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Sequence du genome Streptococcus agalactiae, application au developpement de 
vaccins, d'outils de diagnostic, et a l'identification de cibles therapeutiques. 

L'invention a pour objet la sequence genomique et des sequences nucleotidiques 
5 codant pour des polypeptides de Streptococcus agalactiae, tels que des polypeptides 
d'enveloppe cellulaire, ou des polypeptides secretes ou specifiques, ou impliques dans 
le metabolisme et dans le processus de replication, ainsi que des vecteurs ou cellules 
incluant lesdites sequences. L'invention porte egalement sur leur application au 
developpement de vaccins, d'outils de diagnostic, de puces a ADN et a l'identification 
10 de cibles therapeutiques. 

Streptococcus agalactiae est un streptocoque p-hemolytique qui constitue la 
seule espece appartenant au groupe B de Lancefield (SGB). Les infections neonatales a 
streptocoques du groupe B posent un important probleme de sante publique qui ne se 

1 5 limite pas aux pays en voie de developpement. Leur incidence est de 2,5 pour 1 000 
naissances, avec un taux de mortalite qui varie actuellement dans les pays industrialises 
entre 4 et 10 % selon les etudes. Cette bacterie est responsable d'environ 20 % des 
meningites bacteriennes recensees en France et des sequelles neurologiques sont alors 
observees dans 25 a 50 % des cas. Eile est egalement a l'origine de mort foetale in utero. 

20 Le polyoside capsulaire est l'antigene de surface majeur des SGB. Cinq serotypes (la, 
lb, II, III et V) sont generalement detectes au cours des infections humaines, le serotype 
III etant retrouve dans 75 % des infections neonatales avec atteinte meningee. Au 
niveau cellulaire et moleculaire, les differentes etapes du processus infectieux du a S. 
agalactiae sont encore peu connues. II est vraisemblable que, dans le cas du syndrome 

25 precoce (infections survenant dans les 24 premieres heures), la bacterie inhalee penetre 
dans les cellules de l'epithelium alv^olaire du nouveau-ne et traverse cette barriere pour 
disseminer ulterieurement dans la circulation generale. La genese du syndrome tardif 
precoce (infections survenant entre le 7eme jour et le 3eme mois) et des autres 
infections a SGB reste encore tres mal comprise. Le seul facteur de virulence des SGB 

30 dont le role a ete clairement demontre est le polyoside capsulaire qui permet 
l'echappement au systeme immunitaire de l'hote. La contribution exacte de certaines 
proteines de surface (antigene C, proteine Rib et C5a peptidase) a la virulence de cette 
bacterie est encore peu connue. 
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Une recherche realisee sur le site EXPASY (http://www.expasy.ch/) indique 
qu'il existe 112 references de sequences proteiques dans les banques Swissprot et 
TREMBL. Ce nombre inclut des proteines codees par des plasmides de S. agalactiae. 
Ces sequences represented done une vision partielle d'un nombre limite d'aspect de la 
5 biologie de S. agalactiae. La biosynthese de la capsule polysaccharidique est un des 
aspects les mieux connus de la virulence de cette bacterie. Par ailleurs, les genes codant 
pour 6 proteines exposees a la surface sont egalement connus (3). 

Afin d'appr<§hender de maniere globale les determinants genetiques impliques 

1 0 dans ces processus ainsi que le metabolisme de Streptococcus agalactiae, le sequencage 
du genome de Streptococcus agalactiae a ete realise. Le genome de la souche 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) qui a 6b& responsable d'une 
septicemic mortelle a ete choisi pour ce sequencage. Cette souche possede un serotype 
capsulaire III, ne presente pas de resistance acquise aux antibiotiques, est genetiquement 

1 5 modifiable et est virulente dans un modele d'infection murin. La connaissance complete 
du genome est une etape cruciale pour la caracterisation des genes impliques dans le 
developpement du processus infectieux : adhesion et franchissement des structures 
epitheliales, echappement au systeme immunitaire et adaptation a des conditions de 
culture variees et souvent hostiles (pH, stress oxydatif et carences nurritionnelles), qui 

20 constituent des cibles potentielles pour de nouvelles strategies therapeutiques. La 
comparaison du genome de S. agalactiae avec ceux d'autres pathogenes a Gram positif 
(Streptococcus pyogenes, Streptococcus pneumoniae, Streptococcus mutans, 
Staphylococcus aureus, Listeria monocytogenes, ...) doit permettre d'identifier de 
nouveaux genes de virulence ainsi crue nouvelles cibles pour constmire des souches de 

25 virulence attenuees et des vaccins. Les proteines de surfaces constituent des candidats 
pour une future preparation vaccinale. Dans les tableaux 2 et 6 ci-apres sont repertories 
respectivement 25 et 30 nouveaux genes, nouvellement identifies, codant pour des 
proteines potentiellement liees au peptidoglycane et presentant le motif de liaison 
LPXTG. 

30 

La sequence complete du genome de Streptococcus agalactiae (CIP 82.45 
(ATCC 12403)) a ete obtenue. Ce genome est constitue d'un chromosome long 
d'environ 2,2 Mb identify ici sous forme de 138 contigs representes par les sequences 
SEQ ID No. 1 a SEQ ID No. 136, SEQ ID No. 138 et SEQ ID No. 139, et d'un plasmide 
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long de 45 kbases present dans la souche sequencee represente par la sequence SEQ ID 
No. 137. La sequence complete du genome est representee par la sequence SEQ ID No. 
2345. 

Une liste des phases codantes annotees identifiees par l'analyse des sequences de 
5 ces contigs est donnee au tableau 1. 

Une liste des phases codantes pour des proteines de surface nouvellement 
identifiees est donnee au tableau 2 comme indiquS prec&iemment. 

Une liste des phases codantes annotees identifiees par l'analyse de la sequence 
genomique complete SEQ ID No. 2345 est donnee au tableau 3. 
1 0 Une liste des phases codantes pour des proteines de surface identifiees a partir 

de l'analyse de la sequence genomique complete SEQ ID No. 2345 est donnee au 
tableau 6 (proteines liees au peptidoglycane), tableau 8 (lipoproteines).Tableau 9 (autres 
proteines de suface), Tableau 10( proteines impliquees dans la biosynthese des 
composes polysaccharidiques) 

15 

La presente invention concerne les sequences nucleotidiques et polypeptidiques 
de Streptococcus agalactiae CIP 82.45 (ATCC 12403). 

Ainsi, c'est un objet de la presente invention que de caracteriser la sequence du 
genome de Streptococcus agalactiae, CIP 82.45 (ATCC 12403) contenu dans la banque 
20 genomique preparee a partir du genome de cette souche et deposee a la CNCM le 28 
decembre 2000 sous le numero 1-2610, ainsi que de tous les genes et sequences 
regulatrices non codantes contenus dans ledit genome. 

La presente invention concerne done une sequence nucleotidique isolee et/ou 
purifiee de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi les 
25 sequences SEQ ID No. 1 a SEQ ID No. 1 39 et la sequence SEQ ID No. 2345. 

La presente invention concerne egalement une sequence nucleotidique isolee 
et/ou purifiee, issue de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie 
parmi : 

a) une sequence nucleotidique comportant au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 
30 98 % d'identite avec une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et 

SEQ ID No. 2345 ; 

b) une sequence nucleotidique hybridant dans des conditions de forte stringence avec 
une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, 
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et comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 
150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

c) une sequence nucleotidique complementaire d'une sequence choisie parmi SEQ ID 
No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou complementaire d'une sequence 

5 nucleotidique telle que definie en a), ou b), ou une sequence nucleotidique de 1'ARN 
correspondant a l'une des sequences a) ou b) ; 

d) une sequence nucleotidique d'un fragment representatif d'une sequence choisie 
parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou d'un fragment 
representatif d'une sequence nucleotidique telle que deTinie en a), b) ou c) et 

10 comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 150, 
200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

e) une sequence nucleotidique comprenant une sequence telle que definie en a), b), c) 
ou d) ; et 

f) une sequence nucleotidique telle que definie en a), b), c), d) ou e) modifiee, de 
1 5 preference comportant au plus 10 %, 5 %, 1 % ou 0, 5 % de nucleotides modifies par 

rapport a la sequence de reference. 

De facon plus particuliere, la presente invention a egalement pour objet les 
sequences nucleotidiques isolees et/ou purifiees, caracterisees en ce qu'elles sont issues 
de SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et en ce qu'elles codent pour 
20 un polypeptide choisi parmi les polypeptides de sequence SEQ ID No. 140 a SEQ ID 
No. 2344, et SEQ ID No. 2346 a SEQ ID No. 4481. 

La presente invention concerne aussi de facon plus generate les sequences 
nucleotidiques issues de SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et 
codant pour un polypeptide de Streptococcus agalactia, telles qu'elles peuvent etre 
25 isolees a partir de SEQ ID No. 1 a SEQ ID No. 1 39 et SEQ ID No. 2345. 

De plus, les sequences nucleotidiques isolees et/ caracterisees en ce qu'elles 
comprennent une sequence nucleotidique choisie parmi : 

a) une sequence nucleotidique codant pour un polypeptide choisi parmi les sequences 
SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 ; 
30 b) une sequence nucleotidique comportant au moins 75 %,. 80 %, 85 %, 90 %, 95 % ou 
98 % d'identite avec une sequence nucleotidique codant pour un polypeptide choisi 
parmi les sequences SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ 
ID No. 4481 ; 



WO 02/092818 



5 



PCT7IB02/03059 



c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique codant pour un polypeptide, choisi parmi les sequences 
SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481, et 
comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 150, 

5 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle que 
definie en a), b), c) ou d) et comprenant au moins 20 nucleotides, de preference 25, 

10 30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 
nucleotides ; et 

f) une sequence telle que definie en a), b), c), d) ou e) modifiee, de preference 
comportant au plus 10 %, 5 %, 1 % ou 0,5 % de nucleotides modifies par rapport a la 
sequence de reference, 

1 5 sont egalement des objets de 1 ' invention. 

Selon une realisation avantageuse, l'invention a pour objet les sequences 
nucleotidiques isolees et/ caracterisees en ce qu'elles comprennent une sequence 
nucleotidique choisie parmi : 

a) une sequence nucleotidique SEQ ID No. 4482 a SEQ ID No. 6617 ; 
20 b) une sequence nucleotidique comportant au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 
98 % d'identite avec une sequence nucleotidique choisi parmi les sequences SEQ ID 
No. 2346 a SEQ ID No. 4481 ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique choisi parmi les sequences SEQ ID No. 4482 a SEQ ID 
No. 6617, et comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 
75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle que 
definie en a), b), c) ou d) et comprenant au moins 20 nucleotides, de preference 25, 
30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 
nucleotides ; et 
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f) une sequence telle que definie en a), b), c), d) ou e) modifiee, de preference 
comportant au plus 10 %, 5 %, 1 % ou 0,5 % de nucleotides modifies par rapport a la 
sequence de reference, 

5 Par acide nucleique, sequence nucleique ou d'acide nucleique, polynucleotide, 

oligonucleotide, sequence de polynucleotide, sequence nucleotidique, termes qui seront 
employes indifferemment dans la presente description, on entend designer un 
enchainement precis de nucleotides, modifies ou non, permettant de definir un fragment 
ou une region d'un acide nucleique, comportant ou non des nucleotides non naturels, et 
10 pouvant corresponds aussi bien a un ADN double brin, un ADN simple brin qu'a des 
produits de transcription desdits ADNs. Ainsi, les sequences nucleiques selon 
l'invention englobent egalement les PNA (Peptid Nucleic Acid). 

II doit etre compris que la presente invention ne concerne pas les sequences 
nucleotidiques dans leur environnement chromosomique naturel, c'est-a-dire a l'etat 
1 5 naturel. II s'agit de sequences qui ont ete isolees et/ou purifiees, c'est-a-dire qu'elles ont 
ete prelevees directement ou indirectement, par exemple par copie, leur environnement 
ayant ete au moins partiellement modifie. On entend ainsi egalement designer les acides 
nucleiques obtenus par synthese chimique. 

Par « pourcentage d'identite » entre deux sequences d'acides nucleiques ou 
20 d'acides amines au sens de la presente invention, on entend designer un pourcentage de 
nucleotides ou de residus d'acides amines identiques entre les deux sequences a 
comparer, obtenu apres le meiUeur alignement, ce pourcentage etant purement 
statistique et les differences entre les deux sequences etant reparties au hasard et sur 
toute leur longueur. On entend designer par "meilleur alignement" ou "alignement 
25 optimal", l'alignement pour lequel le pourcentage d'identite determine comme ci-apres 
est le plus eleve. Les comparisons de sequences entre deux sequences d'acides 
nucleiques ou d'acides amines sont traditionnellement realisees en comparant ces 
sequences apres les avoir alignees de maniere optimale, ladite comparaison etant 
realisee par segment ou par « fenerre de comparaison » pour identifier et comparer les 
30 regions locales de similarite de sequence. L'alignement optimal des sequences pour la 
comparaison peut etre realise, outre manuellement, au moyen de 1'algorithme 
d'homologie locale de Smith et Waterman (1981, Ad. App. Math. 2:482), au moyen de 
1'algorithme d'homologie locale de Neddleman et Wunsch (1970, J. Mol. Biol. 48:443), 
au moyen de la methode de recherche de similarite de Pearson et Lipman (1988, Proc. 
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Natl. Acad. Sci. USA 85:2444), au moyen de logiciels informatiques utilisant ces 
algorithmes (GAP, BESTFIT, BLAST P, BLAST N, FASTA et TFASTA dans le 
Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., 
Madison, WI). Afin d'obtenir l'alignement optimal, on utilise de preference le 
5 programme BLAST, avec la matrice BLOSUM 62. On peut egalement utiliser les 
matrices PAM ou PAM250. 

Le pourcentage d'identite entre deux sequences d'acides nucleiques ou d'acides 
amines est determine en comparant ces deux sequences alignees de maniere optimale, la 
sequence d'acides nucleiques ou d'acides amines a comparer pouvant comprendre des 
10 additions ou des deletions par rapport a la sequence de reference pour un alignement 
optimal entre ces deux sequences. Le pourcentage d'identite est calcule en determinant 
le nombre de positions identiques pour lesquelles le nucleotide ou le residu d'acide 
amine est identique dans les deux sequences, en divisant ce nombre de positions 
identiques par le nombre total de positions comparees et en multipliant le resultat 
1 5 obtenu par 1 00 pour obtenir le pourcentage d'identite entre ces deux sequences. 

Par sequences nucleiques presentant un pourcentage d'identite d'au moins 75 %, 
de preference 80 %, 85 % ou 90 %, de facon plus preferee 95 % voire 98 %, apres 
alignement optimal avec une sequence de reference, on entend designer les sequences 
nucleiques presentant, par rapport a la sequence nucleique de reference, certaines 
20 modifications comme en particulier une deletion, une troncation, un allongement, une 
fusion chimerique et/ou une substitution, notamment ponctuelle, et dont la sequence 
nucleique presente au moins 75 %, de preference 80 %, 85 %, 90 %, 95 % ou 98 %, 
d'identite apres alignement optimal avec la sequence nucleique de reference. II s'agit de 
preference de sequences dont les sequences complementaires sont susceptibles de 
25 s'hybrider specifiquement avec les sequences de reference. De preference, les 
conditions d'hybridation specifiques ou de forte stringence seront telles qu'elles 
assurent au moins 75 %, de preference 80 %, 85 %, 90 %, 95 % ou 98 % d'identite 
apres alignement optimal entre l'une des deux sequences et sa sequence 
complementaire. 

Une hybridation dans des conditions de forte stringence signifie que les 
conditions de temperature et de force ionique sont choisies de telle maniere qu'elles 
permettent le maintien de l'hybridation entre deux fragments d'ADN complementaires. 
A titre illustratif, des conditions de forte stringence de l'etape d'hybridation aux fins de 
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definir les fragments polynucleotidiques decrits ci-dessus, sont avantageusement les 
suivantes. 

L'hybridation ADN-ADN ou ADN-ARN est realisee en deux etapes : (1) 
prehybridation a 42°C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) 
5 contenant 5 x SSC (1 x SSC correspond a une solution 0,15 M NaCl + 0,015 M citrate 
de sodium), 50 % de formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x 
Denhardt's, 5 % de dextran sulfate et 1 % dADN de sperme de saumon ; (2) hybridation 
proprement dite pendant 20 heures a une temperature dependant de la taille de la sonde 
(i.e. : 42°C, pour une sonde de taille > 100 nucleotides) suivie de 2 lavages de 20 
1 0 minutes a 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes a 20°C en 0,1 x SSC + 
0,1 % SDS. Le dernier lavage est pratique en 0,1 x SSC + 0,1 % SDS pendant 30 
minutes a 60°C pour une sonde de taille > 100 nucleotides. Les conditions d'hybridation 
de forte stringence decrites ci-dessus pour un polynucleotide de taille definie, peuvent 
etre adaptees par l'homme du metier pour des oligonucleotides de taille plus grande ou 
15 plus petite, selon l'enseignement de Sambrook et al., (1989, Molecular cloning : a 
laboratory manual. 2 nd Ed. Cold Spring Harbor). 

De plus, par fragment representatif de sequences selon 1' invention, on entend 
designer tout fragment nucleotidique presentant au moins 15 nucleotides, de preference 
au moins 25, 30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 450, 500, 750, 1000 ou 
20 1 500 consecutifs de la sequence dont il est issu. 

Par fragment representatif, on entend en particulier une sequence nucleique 
codant pour un fragment biologiquement actif d'un polypeptide, tel que defini plus loin. 

Par fragment representatif, on entend egalement les sequences intergeniques, et 
en particulier les sequences nucleotidiques portant les signaux de regulation 
25 (promoteurs, terminateurs, voire enhancers, . . .). 

Parmi lesdits fragments representatifs, on prefere ceux ayant des sequences 
nucleotidiques correspondant a des cadres ouverts de lecture, denommes sequences 
ORFs (ORF pour « Open Reading Frame »), compris en general entre un codon 
d' initiation et un codon stop, ou entre deux codons stop, et codant pour des 
30 polypeptides, de preference d'au moins 1 00 acides amines, tel que par exemple, sans s'y 
limiter, les sequences ORFs qui seront decrites par la suite. 

La numerotation des sequences nucleotidiques ORFs qui sera utilisee par la suite 
dans la presente description correspond a la numerotation des sequences d'acides 
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amines des proteines codees par lesdites ORFs pour les peptides de sequence SEQ ID 
No. 140 a SEQ ID No. 2344 et SEQ ID No.2346 a SEQ ID No.4481 . 

Les fragments representatifs selon l'invention peuvent etre obtenus par exemple 
par amplification specifique telle que la PCR ou apres digestion par des enzymes de 
5 restriction appropries de sequences nucleotidiques selon l'invention, cette methode etant 
decrite en particulier dans l'ouvrage de Sambrook et al.. Lesdits fragments 
representatifs peuvent egalement etre obtenus par synthese chimique lorsque leur taille 
n'est pas trop importante, selon des methodes bien connues de rhomme du metier. 

Parmi les sequences contenant des sequences de l'invention, ou des fragments 
10 representatifs, on entend egalement les sequences qui sont naturellement encadrees par 
des sequences qui presentment au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 98 % 
d'identite avec les sequences selon l'invention. 

Par sequence nucleotidique modifiee, on entend toute sequence nucleotidique 
obtenue par mutagenese selon des techniques bien connues de l'homme du metier, et 
15 comportant des modifications par rapport aux sequences normales, par exemple des 
mutations dans les sequences regulatrices et/ou promotrices de l'expression du 
polypeptide, notamment conduisant a une modification du taux d'expression ou de 
l'activite dudit polypeptide. 

Par sequence nucleotidique modifiee, on entend egalement toute sequence 
20 nucleotidique codant pour un polypeptide modifie tel que definit ci-apres. 

Concernant les sequences nucleiques ou ORF codant pour les peptides de 
sequence SEQ ID No. 2346 a SEQ ID No. 4481, ces sequences nucleiques ou ORF sont 
representees respectivement par les sequences SEQ ID No. 4482 a SEQ ID No. 6617. 

L'invention concerne avantageusement une sequence nucleotidique isolee de 
25 Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi : 

a) une sequence choisie parmi les sequences SEQ ID N° 
6 1 94,6236,5497,579 1 ,5 1 03,4705,56 1 0,5234,4926,633 1 ,6247,5842,5741 ,492 1 ,5090, 
5180,4706,4708,5677,6246,6411,5578,6446,6447,5607,6209,6215,5406,5658,4965, de 
preference parmi les sequences SEQ ID N°4926,633 1,5491, 5234,6246,5842 ; 
30 b) une sequence nucleotidique comportant au moins 75 % d'identite avec une 

sequence nucleotidique du a) ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucleotidique du a) ou b) et comprenant au moins 20 
nucleotides ; 
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d) une sequence nucleotidique complementaire ou d' ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle 
que definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 

5 f) une sequence telle que definie en a), b), c), d) ou e) modifiee et comportant 

au plus 1 0 % de nucleotides modifies par rapport a la sequence de reference ; 

et en ce qu'elle code pour une proteine de surface avec un motif d'ancrage 
LPXTG. 

L'invention concerne egalement les polypeptides codes par ces sequences. 

10 L'invention concerne egalement avantageusement une sequence nucleotidique 

isolee de Streptococcus agalactiae caracterisee en ce qu'elle est choisie parmi les 
sequences SEQ ID 

N°6035,6137,6335,6377,6386,4495,4596,4636,4730,4816,4836,4906,4920,4925,5158, 
5247, 5306,5417,5450,5486,5559,5591,5677,5732,5799,5800,5861,5923 ; et en ce 

1 5 qu'elle code pour une lipoproteine. L'invention concerne egalement les polypeptides 
codes par ces sequences. 

L'invention concerne egalement avantageusement une sequence nucleotidique 
isolee de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi les 
sequences SEQ ID 

20 N°4861,6214,6061,6517,6518,6519,4743,6343,6342,5326,4952,5619,5618,5617,5616, 
5615,5614,5613,5611,5696,5971,5233,5602,5156,5574,5573,5654,5656,5526,5527,552 
9,5534,5625,5626,6223,6229,6230,6231,6232,6233,5764,6095,5089,5466,5465 ; et en 
ce qu'elle code pour une proteine impliquee dans la biosynthese de composes 
polysaccharidiques de paroi. L'invention concerne egalement les polypeptides codes par 

25 ces sequences. 

Les fragments repr^sentatifs selon l'invention peuvent egalement etre des sondes 
ou amorces, qui peuvent etre utilisees dans des precedes de detection, d' identification, 
de dosage ou d' amplification de sequences nucl&ques. 

Une sonde ou amorce se definit, au sens de l'invention, comme etant un 

30 fragment d'acides nucleiques simple brin ou un fragment double brin denature 
comprenant par exemple de 12 bases a quelques kb, notamment de 15 a quelques 
centaines de bases, de preference de 15 a 50 ou 100 bases, et possedant une specificite 
d'hybridation dans des conditions determinees pour former un complexe d'hybridation 
avec un acide nucl&que cible. 
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Les sondes et amorces selon l'invention peuvent etre marquees directement ou 
indirectement par un compose radioactif ou non radioactif par des methodes bien 
connues de rhomme du metier, afin d'obtenir un signal detectable et/ou quantifiable 
(brevet FR 78 10975 et bDNA de Chiron EP 225 807 et EP 510 085). 
5 Les sequences non marquees de polynucleotides selon l'invention peuvent etre 

utilises directement comme sonde ou amorce. 

Les sequences sont generalement marquees pour obtenir des sequences 
utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes 
selon l'invention est realise par des elements radioactifs ou par des molecules non 
1 0 radioactives. 

Parmi les isotopes radioactifs utilises, on peut citer le 32 P, le 33 P, le 35 S, le 3 H ou 
le 125 I. Les entites non radioactives sont selectionnees parmi les ligands tels la biotine, 
l'avidine, la streptavidine, la dioxygenine, les haptenes, les colorants, les agents 
luminescents tels que les agents radioluminescents, chemoluminescents, 

1 5 bioluminescents, fluorescents, phosphorescents. 

Les polynucleotides selon l'invention peuvent ainsi etre utilises comme amorce 
et/ou sonde dans des precedes mettant en oeuvre notamment la technique de PCR 
(amplification en chaine par polymerase) (Rolfs et al., 1991, Berlin : Springer- Verlag). 
Cette technique necessite le choix de paires d'amorces oligonucleotidiques encadrant le 

20 fragment qui doit etre amplifie. On peut, par exemple, se referer a la technique decrite 
dans le brevet americain U.S. N° 4,683,202. Les fragments amplifies peuvent etre 
identifies, par exemple apres une electrophorese en gel d'agarose ou de polyacrylamide, 
ou apres une technique chromatographique comme la filtration sur gel ou la 
chromatographic echangeuse d'ions, puis sequences. La specificite de 1' amplification 

25 peut etre controlee en utilisant les sequences nucleotidiques de polynucleotides de 
l'invention comme matrice, des plasmides contenant ces sequences ou encore les 
produits d'amplification derives. Les fragments nucleotidiques amplifies peuvent etre 
utilises comme reactifs dans des reactions d'hybridation afin de mettre en evidence la 
presence, dans un echantillon biologique, d'un acide nucleique cible de sequence 

30 complementaire a celle desdits fragments nucleotidiques amplifies. 

L'invention vise egalement les acides nucleiques susceptibles d'etre obtenus par 
amplification a l'aide d'amorces selon l'invention. 

D'autres techniques d'amplification de l'acide nucleique cible peuvent etre 
avantageusement employees comme alternative a la PCR (PCR-like) a l'aide de couple 
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d'amorces de sequences nucleotidiques selon l'invention. Par PCR-like on entend 
designer toutes les methodes mettant en oeuvre des reproductions directes ou indirectes 
des sequences d'acides nucleiques, ou bien dans lesquelles les systemes de marquage 
ont &e amplifies, ces techniques sont bien entendu connues. En general il s'agit de 
5 1'amplification de l'ADN par une polymerase ; lorsque l'echantillon d'origine est un 
ARN il convient prealablement d'effectuer une transcription reverse. II existe 
actuellement de tres nombreux proc&les permettant cette amplification, comme par 
exemple la technique SDA (Strand Displacement Amplification) ou technique 
d'amplification a deplacement de brin (Walker et al., 1992, Nucleic Acids Res. 

10 20:1691), la technique TAS (Transcription-based Amplification System) decrite par 
Kwoh et al. (1989, Proc. Natl. Acad. Sci., USA, 86, 1173), la technique 3SR (Self- 
Sustained Sequence Replication) decrite par Guatelli et al. (1990, Proc. Natl. Acad. Sci., 
USA 87:1874), la technique NASBA (Nucleic Acid Sequence Based Amplification) 
decrite par Kievitis et al. (1991, J. Virol. Methods, 35, 273), la technique TMA 

15 (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) 
decrite par Landegren et al. (1988, Science 241, 1077), la technique de RCR (Repair 
Chain Reaction) decrite par Segev (1992, Kessler C. Springer Verlag, Berlin, New- 
York, 197-205), la technique CPR (Cycling Probe Reaction) decrite par Duck et al. 
(1990, Biotechniques, 9, 142), la technique d'amplification a la Q-beta-replicase decrite 

20 par Miele et al. (1983, J. Mol. Biol., 171, 281). Certaines de ces techniques ont depuis 
6tt perfectionnees. 

Dans le cas ou le polynucleotide cible a d&ecter est un ARNm, on utilise 
avantageusement, prealablement a la mise en oeuvre d'une reaction d'amplification a 
l'aide des amorces selon l'invention ou a la mise en oeuvre d'un precede de detection a 

25 l'aide des sondes de l'invention, une enzyme de type transcriptase inverse afin d'obtenir 
un ADNc a partir de l'ARNm contenu dans l'echantillon biologique. L'ADNc obtenu 
servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le procede 
d'amplification ou de detection selon l'invention. 

La technique d'hybridation de sondes peut etre realisee de manieres diverses 

30 (Matthews et al., 1988, Anal. Biochem., 169, 1-25). La methode la plus generate 
consiste a immobiliser 1'acide nucleique extrait des cellules de differents tissus ou de 
cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrene) et 
a incuber, dans des conditions bien definies, 1'acide nucteique cible immobilise avec la 
sonde. Apres l'hybridation, l'exces de sonde est elimine et les molecules hybrides 
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formees sont detectees par la methode appropriee (mesure de la radioactivite, de la 
fluorescence ou de Pactivite enzymatique liee a la sonde). 

Selon un autre mode de mise en ocuvre des sondes nucleiques selon l'invention, 
ces dernieres peuvent etre utilisees comme sondes de capture. Dans ce cas, une sonde, 
5 dite « sonde de capture », est immobilisee sur un support et sert a capturer par 
hybridation specifique l'acide nuclelque cible obtenu a partir de Pechantillon biologique 
a tester et l'acide nucleique cible est ensuite detecte grace a une seconde sonde, dite 
« sonde de detection », marquee par un element facilement detectable. 

Parmi les fragments d'acides nucleiques interessants, il faut ainsi citer en 

10 particulier les oligonucleotides anti-sens, c'est-a-dire dont la structure assure, par 
hybridation avec la sequence cible, une inhibition de Pexpression du produit 
correspondant. II faut egalement citer les oligonucleotides sens qui, par interaction avec 
des prolines impliquees dans la regulation de Pexpression du produit correspondant, 
induiront soit une inhibition, soit une activation de cette expression. 

15 De facon preferee, les sondes ou amorces selon l'invention sont immobilisees 

sur un support, de maniere covalente ou non covalente. En particulier, le support peut 
etre une puce a ADN ou un filtre a haute ou moyenne densite, egalement objets de la 
presente invention (brevets WO 97/29212, WO 98/27317, WO 97/10365 et WO 
92/10588). 

20 On entend designer par puce a ADN ou filtre haute densite, un support sur lequel 

sont fixees des sequences d'ADN, chacune d'entre elles pouvant etre reperee par sa 
localisation geographique. Ces puces ou filtres different principalement par leur taille, le 
materiau du support, et eventuellement le nombre de sequences d'ADN qui y sont 
fixees. 

25 On peut fixer les sondes ou amorces selon la premiere invention sur des supports 

solides, en particulier les puces a ADN, par differents procedes de fabrication. En 
particulier, on peut effectuer une synthese in situ par adressage photochimique ou par jet 
d'encre. D'autres techniques consistent a effectuer une synthese ex situ et a fixer les 
sondes sur le support de la puce a ADN par adressage mecanique, electronique ou par 

30 jet d'encre. Ces differents procedes sont bien connus de Phomme du metier. 

Une sequence nucleotidique (sonde ou amorce) selon {'invention permet done la 
detection et/ou Pamplification de sequences nucleiques specifiques. En particulier, la 
detection de cesdites sequences est facilitee lorsque la sonde est fixee sur une puce a 
ADN, ou a un filtre haute densite. 
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L'utilisation de puces a ADN ou de filtres a haute density permet en effet de 
determiner Pexpression de genes dans un organisme presentant une sequence 
genomique proche de Streptococcus agalactiae et le typage de la souche en cause. 

La sequence genomique de Streptococcus agalactiae, completee par 
5 1' identification des genes de ces organismes, telle que presentee dans la presente 
invention, sert de base a la construction de ces puces a ADN ou filtre. 

La preparation de ces filtres ou puces consiste a synthetiser des oligonucleotides, 
correspondant aux extremites 5' et 3' des genes ou a des fragments plus internes pour 
amplifier des fragments d'une taille adaptee, par exemple comprise environ entre 300 et 

10 800 bases. Ces oligonucleotides sont choisis en utilisant la sequence genomique et ses 
annotations divulguees par la presente invention. La temperature d'appariement des ces 
oligonucleotides aux places correspondantes sur l'ADN doit etre approximativement la 
meme pour chaque oligonucleotide. Ceci permet de preparer des fragments d'ADN 
correspondant a chaque gene par l'utilisation de conditions de PCR appropriees dans un 

1 5 environnement hautement automatise. Les fragments amplifies sont ensuite immobilises 
sur des filtres ou des supports en verre, silicium ou polymeres synthetiques et ces 
milieux sont utilises pour Phybridation. 

La disponibilite de tels filtres et/ou puces et de la sequence genomique 
correspondante annotee permet d'etudier l'expression de grands ensembles, voire de la 

20 totalite des genes dans les micro-organismes associes a Streptococcus agalactiae et 
Streptococcus agalactiae CIP 82.45 (ATCC 12403), en preparant les ADNs 
complementaires, et en les hybridant a l'ADN ou aux oligonucleotides immobilises sur 
les filtres ou les puces. De meme, les filtres et/ou les puces permettent d'etudier la 
variability des souches ou des especes, en preparant l'ADN de ces organismes et en les 

25 hybridant a l'ADN ou aux oligonucleotides immobilises sur les filtres ou les puces. 

Les differences entre les sequences genomiques des differentes souches ou 
especes peuvent grandement affecter rintensite" de l'hybridation et, par consequent, 
perturber Interpretation des resultats. II peut done etre necessaire d'avoir la sequence 
precise des genes de la souche que Ton souhaite etudier. La methode de detection des 

30 genes decrite plus loin en detail, impliquant la determination de la sequence de 
fragments aleatoires d'un genome, et les organisant d'apres la sequence du genome de 
Streptococcus agalactiae, notamment de Streptococcus agalactiae CIP 82.45 (ATCC 
12403) divulguee dans la presente invention, peut etre tres utile. 
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Les sequences nucleotidiques selon l'invention peuvent etre utilisees dans des 
puces a ADN pour effectuer 1'analyse de mutations. Cette analyse repose sur la 
constitution de puces capables d'analyser chaque base d'une sequence nucleotidique 
selon l'invention. On pourra notamment a cette fin mettre en oeuvre les techniques de 
5 microsequencage sur puce a ADN. Les mutations sont detectees par extension 
d'amorces immobilisees hybridant a la matrice des sequences analysees, juste en 
position adjacente de celle du nucleotide mute recherche. Une matrice simple brin, ARN 
ou ADN, des sequences a analyser sera avantageusement preparee selon des methodes 
classiques, a partir de produits amplifies selon les techniques de type PCR. Les matrices 

10 d'ADN simple brin, ou d'ARN ainsi obtenues sont alors deposees sur la puce a ADN, 
dans des conditions permettant leur hybridation specifique aux amorces immobilisees. 
. Une polymerase thermostable, par exemple la Tth ou la Taq ADN polymerase, etend 
specifiquement l'extremite 3' de l'amorce immobilisee avec un analogue de nucleotide 
marque complementaire du nucleotide en position du site variable ; par exemple, un 

1 5 cyclage thermique est realise en presence des dideoxyribonucleotides fluorescents. Les 
conditions experimentales seront adaptees notamment aux puces employees, aux 
amorces immobilisees, aux polymerases employees, et au systeme de marquage choisi. 
Un avantage du microsequencage, par rapport aux techniques basees sur l'hybridation 
de sondes, est qu'il permet d'identifier tous les nucleotides variables avec une 

20 discrimination optimale dans des conditions de reactions homogenes ; utilise sur des 
puces a ADN, il permet une resolution et une specificite optimales pour la detection 
routiniere et industrielle de mutations en multiplex. 

Une puce a ADN ou un filtre peut etre un outil extremement interessant pour la 
determination, la detection et/ou 1' identification d'un micro-organisme. Ainsi, on 

25 prefere egalement les puces a ADN selon l'invention qui contiennent en outre au moins 
une sequence nucleotidique d'un micro-organisme autre que Streptococcus agalactiae 
CIP 82.45 (ATCC 12403) ou Streptococcus agalactiae, immobilisee sur le support de 
ladite puce. De preference, le micro-organisme choisi Test parmi les bacteries du genre 
Streptococcus (ci-apres designees comme bacteries associees a Streptococcus 

30 agalactiae), ou les variants de Streptococcus agalactiae CIP 82.45 (ATCC 12403). 

Une puce a ADN ou un filtre selon l'invention est un element tres utile de 
certains kits ou necessaires pour la detection et/ou 1' identification de micro-organismes, 
en particulier les bacteries appartenant a l'espece Streptococcus agalactiae ou les 
micro-organismes associes, egalement objets de l'invention. 



WO 02/092818 



16 



PCTYIB02/03059 



Par ailleurs, les puces a ADN ou les filtres selon l'invention, contenant des 
sondes ou amorces specifiques de Streptococcus agalactiae, sont des elements tres 
avantageux de kits ou necessaires pour la detection et/ou la quantification de 
I'expression de genes de Streptococcus agalactiae (ou de micro-organismes associes). 
5 En effet, le controle de I'expression des genes est un point critique pour 

optimiser la croissance et le rendement d'une souche, soit en permettant I'expression 
d'un ou plusieurs genes nouveaux, soit en modifiant I'expression de genes deja presents 
dans la cellule. La presente invention fournit l'ensemble des sequences naturellement 
actives chez Streptococcus agalactiae permettant I'expression des genes. Elle permet 

10 ainsi la determination de l'ensemble des sequences exprimees chez Streptococcus 
agalactiae. Elle fournit egalement un outil permettant de reperer les genes dont 
I'expression suit un schema donne. Pour realiser cela, l'ADN de tout ou partie des genes 
de Streptococcus agalactiae peut etre amplifie grace a des amorces selon l'invention, 
puis fixe a un support comme par exemple le verre ou le nylon ou une puce a ADN, afin 

15 de construire un outil permettant de suivre le profil d'expression de ces genes. Cet outil, 
constitue de ce support contenant les sequences codantes sert de matrice d'hybridation a 
un melange de molecules marquees refletant les ARNs messagers exprimes dans la 
cellule (en particulier les sondes marquees selon l'invention). En repetant cette 
experience a differents instants et en combinant l'ensemble de ces donnees par un 

20 traitement approprie\ on obtient alors les profils d'expression de l'ensemble de ces 
genes. La connaissance des sequences qui suivent un schema de regulation donne peut 
aussi etre mise a profit pour rechercher de maniere dirigee, par exemple par homologie, 
d'autres sequences suivant globalement, mais de maniere legerement differente le meme 
schema de regulation. En complement, il est possible d'isoler chaque sequence de 

25 controle presente en amont des segments servant de sondes et d'en suivre l'activite a 
l'aide de moyen approprie comme un gene rapporteur (luciferase, P-galactosidase, 
GFP). Ces sequences isolees peuvent ensuite etre modifiees et assemblies par ingenierie 
metabolique avec des sequences d'interet en vue de leur expression optimale. 

L'invention concerne egalement les polypeptides codes par une sequence 

30 nucleotidique selon l'invention, de preference, par un fragment representatif des 
sequences precedentes et correspondant a une sequence ORF. En particulier, les 
polypeptides de Streptococcus agalactiae CIP 82.45 (ATCC 12403) de SEQ ID No. 140 
a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 sont objet de l'invention. 
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L' invention comprend egalement les polypeptides caracterises en ce qu'ils 
comprennent un polypeptide choisi parmi : 

a) un polypeptide selon l'invention ; 

b) un polypeptide presentant au moins 80 % de preference 85 %, 90 %, 95 % et 98 % 
5 d'identite avec un polypeptide selon l'invention ; 

c) un fragment d'au moins 5 acides amines, de preference d'au moins 10, 15, 20, 25, 
30, 40, 50, 75 et 100 acides amines d'un polypeptide selon l'invention, ou tel que 
defini en b) ; 

d) un fragment biologiquement actif d'un polypeptide selon l'invention, ou tel que 
1 0 defini en b) ou c) ; et 

e) un polypeptide selon l'invention, ou tel que defini en b), c) ou d) modifie et 
comportant au plus 10 %, 5 % ou 1 % d'acides amines modifies par rapport a la 
sequence de reference. 

Les sequences nucleotidiques codant pour les polypeptides decrits 
1 5 precedemment sont egalement objet de l'invention. 

Dans la presente description, les termes polypeptides, sequences 
polypeptidiques, peptides et proteines sont interchangeables. Le terme polypeptide 
comprend toute sequence d'acides amines permettant de generer une reponse anticorps. 

II doit Stre compris que l'invention ne concerne pas les polypeptides sous forme 
20 naturelle, c'est-a-dire qu'ils ne sont pas pris dans leur environnement naturel. En 
revanche, elle concerne ceux qui ont pu etre isoles ou obtenus par purification a partir 
de sources naturelles, ou bien obtenus par recombinaison genetique, ou par synthese 
chimique, et qu'ils peuvent alors comporter des acides amines non naturels comme cela 
sera decrit plus loin. 

25 Par polypeptide presentant un certain pourcentage d'identite avec un autre, que 

Ton designera Egalement par polypeptide homologue, on entend designer les 
polypeptides presentant par rapport aux polypeptides naturels, certaines modifications, 
en particulier une deletion, addition ou substitution d'au moins un acide amine, une 
troncation, un allongement, une solution chimerique et/ou une mutation, ou les 

30 polypeptides presentant des modifications post-traductionnelles. Parmi les polypeptides 
homologues, on prefere ceux dont la sequence d'acides amines presentent au moins 
80%, de preference 85 %, 90 %, 95 % et 98 % d'homologie avec les sequences 
d'acides amines des polypeptides selon l'invention. Dans le cas d'une substitution, un 
ou plusieurs acide(s) amine(s) consecutif(s) ou non consecutif(s) sont remplaces par des 
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acides amines « equivalents ». L' expression « acides amines equivalents » vise ici a 
designer tout acide amine susceptible d'etre substitue a 1'un des acides amines de la 
structure de base sans cependant modifier essentiellement les activites biologiques des 
peptides correspondant telles qu'elles seront definies par la suite. 
5 Ces acides amines equivalents peuvent etre determines soit en s'appuyant sur 

leur homologie de structure avec les acides amines auxquels ils se substituent, soit sur 
des resultats d'essais comparatifs d'activit6 biologique entre les differents polypeptides 
susceptibles d'etre effectues. 

A titre d'exemple, on mentionne les possibilites de substitution susceptibles 

10 d'etre effectuees sans qu'il resulte en une modification approfondie de P activity 
biologique du polypeptide modifie correspondant. On peut remplacer ainsi la leucine 
par la valine ou Pisoleucine, l'acide aspartique par l'acide glutamine, la glutamine par 
Pasparagine, Parginine par la lysine, etc., les substitutions inverses etant naturellement 
envisageables dans les memes conditions. 

1 5 Les polypeptides homologues correspondent egalement aux polypeptides codes 

par les sequences nucleotidiques homologues ou identiques, telles que definies 
precedemment et comprennent ainsi dans la presente definition des polypeptides mutes 
ou correspondant a des variations inter ou intra especes, pouvant exister chez 
Streptococcus, et qui correspondent notamment a des troncatures, substitutions, 

20 deletions et/ou additions, d'au moins un residu d'acides amines. 

II est entendu que Pon calcule le pourcentage d'identite entre deux polypeptides 
de la meme facon qu'entre deux sequences d'acides nucleiques. Ainsi, le pourcentage 
d'identite entre deux polypeptides est calcule apres alignement optimal de ces deux 
sequences, sur une fenetre d'homologie maximale. Pour definir ladite fenetre 

25 d'homologie maximale, on peut utiliser les memes algorithmes que pour les sequences 
d'acide nucl&que. 

Par fragment biologiquement actif d'un polypeptide selon P invention, on entend 
designer en particulier un fragment de polypeptide, tel que defini ci-apres, presentant au 
moins une des caracteristiques biologiques des polypeptides selon P invention, 
30 notamment en ce qu'il est capable d'exercer de maniere generale une activite meme 
partielle, telle que par exemple : 

- une activite enzymatique (metabolique) ou une activite pouvant etre 
impliquee dans la biosynthese ou la biodegradation de composes organiques ou 
inorganiques ; 
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- une activite structurelle (enveloppe cellulaire, molecule chaperonne, 
ribosome) ; 

- une activite de transport (d'energie, d'ion) ; ou dans la secretion de proteine ; 

- une activite dans le processus de replication, amplification, preparation, 
5 transcription, traduction ou maturation, notamment de l'ADN, de l'ARN ou des 

proteines. 

Par fragment de polypeptide selon l'invention, on entend designer un 
polypeptide comportant au minimum 5 acides amines, de preference d'au moins 10, 15, 
20, 25, 30, 40, 50, 75, 100 et 150 acides amines. 

10 Les fragments de polypeptides peuvent correspondre a des fragments isoles ou 

purifies naturellement presents dans les souches de Streptococcus, ou a des fragments 
qui peuvent etre obtenus par clivage dudit polypeptide par une enzyme proteolitique 
telle que la trypsine ou la chymotrypsine ou la collagenase, par un reactif chimique 
(bromure de cyanogene, CNBr) ou en placant ledit polypeptide dans un environnement 

1 5 tres acide (par exemple a pH = 2,5). Des fragments polypeptidiques peuvent egalement 
etre prepares par synthese chimique, a partir d'hotes transformes par un vecteur 
d'expression selon l'invention qui contiennent un acide nucleique permettant 
1' expression dudit fragment, et place sous le controle des elements de regulation et/ou 
d'expression appropries. 

20 Par « polypeptide modifie » d'un polypeptide selon l'invention, on entend 

designer un polypeptide obtenu par recombinaison genetique ou par synthese chimique 
comme decrit plus loin, qui presente au moins une modification par rapport a la 
sequence normale. Ces modifications peuvent etre notamment portees sur des acides 
amines necessaires pour la specificite ou l'efficacite de Pactivite, ou a l'origine de la 

25 conformation structurale, de la charge, ou de l'hydrophobicite du polypeptide selon 
l'invention. On peut ainsi creer des polypeptides d'activite equivalente, augmentee ou 
diminuee, ou de specificite equivalente, plus etroite ou plus large. Parmi les 
polypeptides modifies, il faut citer les polypeptides dans lesquels jusqu'a cinq acides 
amines peuvent etre modifies, tronques a l'extremite N ou C-terminale, ou bien deletes, 

30 ou ajoutes. 

Comme cela est indique, les modifications d'un polypeptide ont pour objectif 
notamment : 

- de permettre sa mise en oeuvre dans des procedes de biosynthese ou de 
biodegradation de composes organiques ou inorganiques, 
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- de permettre sa mise en ceuvre dans des precedes de replication, 
d'amplification, de reparation et regie de transcription, de traduction, ou de maturation 
notamment de l'ADN, l'ARN, ou de proteines, 

- de permettre sa secretion amelioree, 

5 - de modifier sa solubility l'efficacite" ou la specificite de son activity ou 

encore de faciliter sa purification. 

La synthese chimique presente 6galement l'avantage de pouvoir utiliser des 
acides amines non naturels ou des liaisons non peptidiques. Ainsi, il peut etre 
interessant d'utiliser des acides amines non naturels, par exemple sous forme D, ou des 
1 0 analogues d' acides amines, notamment des formes souffrees. 

La presente invention fournit la sequence nucleotidique du genome de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) sous forme de contigs, ainsi que 
certaines sequences polypeptidiques. 

D'une maniere preferee, l'invention est relative a une sequence nucleotidique 
1 5 selon l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
biosynthese des acides amines. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
20 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
biosynthese des cofacteurs, groupes prosthetiques et transporteurs. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide d'enveloppe cellulaire 
ou present a la surface de Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou pour 
25 un de ses fragments. 

De maniere preTeree, l'invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
machinerie cellulaire. 

30 De maniere preferee, l'invention est relative a une sequence nucleotidique selon 

l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme intermediate central. 
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De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
1' invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme energetique. 
5 De maniere preferee, l'invention est relative a une sequence nucleotidique selon 

l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments impliqu6 dans le 
metabolisme des acides gras et des phospholipides. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
10 l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme des nucleotides, des purines, des pyrimidines ou nucleosides. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
15 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans les 
fonctions de regulation. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
20 de replication. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de transcription. 

25 De maniere preferee, l'invention est relative a une sequence nucleotidique selon 

l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de traduction. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
30 l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de transport et de liaison des proteines. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
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agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans l'adaptation 
aux conditions atypiques. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
5 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments dans la sensibilite aux 
medicaments et analogues. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans les 
1 0 fonctions relatives aux transposons. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide specifique de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
15 polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la biosynthese des acides amines. 

Sous un autre aspect, de maniere preTeree, l'invention a pour objet un 
polypeptide selon l'invention, caracterise' en ce qu'il s'agit d'un polypeptide de 
20 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la biosynthese des cofacteurs, groupes prosthetiques et transporteurs. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide 
d'enveloppe cellulaire ou de surface de Streptococcus agalactiae CIP 82.45 (ATCC 
25 1 2403) ou un de ses fragments. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la machinerie cellulaire. 
30 Sous un autre aspect, de maniere preferee, l'invention a pour objet un 

polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme intermediaire central. 
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Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon rinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme energetique. 
5 Sous un autre aspect, de maniere preferee, l'invention a pour objet un 

polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme des acides gras et des phospholipides. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
10 polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique" 
dans le metabolisme des nucleotides, des purines, des pyrimidines ou nucleosides. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise" en ce qu'il s'agit d'un polypeptide de 
15 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans les fonctions de regulation. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
20 dans le processus de replication. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de transcription. 
25 Sous un autre aspect, de maniere preferee, l'invention a pour objet un 

polypeptide selon l'invention, caract&ise" en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de traduction. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
30 polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de transport et de liaison des proteines. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 



PCT/IB02/03059 



Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans l'adaptation aux conditions atypiques. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
5 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments dans la 
sensibilite aux medicaments et analogues. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
1 0 dans les fonctions relatives aux transposons. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide specifique 
de Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments. 

L'invention a egalement pour objet les operons impliques dans la synthese 
15 d' antibiotiques et/ou de toxines. 

Le tableau 1 fournit la liste de certains polypeptides selon l'invention, ainsi que 
leur localisation dans les sequences SEQ ID No. 1 a SEQ ID No. 139, et les analogies 
observees apres comparaison dans les bases de donnees. 

20 II est important de noter toutefois qu'un organisme vivant est un tout et doit etre 

pris comme tel. Ainsi, afin de pouvoir se developper et exhiber ses proprietes, tout 
organisme a besoin d' interactions entre les differentes voies m£taboliques. Ainsi, la 
classification enoncee ci-dessus ne doit pas etre consideree comme limitative, un gene 
pouvant etre implique" dans deux voies metaboliques distinctes. 

25 La presente invention a egalement pour objet les sequences nucleotidiques et/ou 

de polypeptides selon l'invention, caract<§ris£es en ce que lesdites s6quences sont 
enregistrees sur un support d'enregistrement dont la forme et la nature facilitent la 
lecture, l'analyse et/ou 1' exploitation de ladite ou desdites sequence(s). Ces supports 
peuvent egalement contenir d'autres informations extraites de la presente invention, 

30 notamment les analogies avec des sequences deja connues, et/ou des informations 
concernant les sequences nucleotidiques et/ou de polypeptides d'autres micro- 
organismes afin de faciliter l'analyse comparative et 1' exploitation des resultats obtenus. 

Parmi cesdits supports d'enregistrement, on prefere en particulier les supports 
lisibles par un ordinateur, tels les supports magnetiques, optiques, electriques ou 
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hybrides, en particulier les disquettes informatiques, les CD-ROM, les serveurs 
informatiques. De tels supports d'enregistrement sont egalement objet de l'invention. 

Les supports d'enregistrement selon l'invention, avec les informations 
apportees, sont tres utiles pour le choix d' amorces ou de sondes nucleotidiques pour la 
5 determination de genes dans Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou 
souches proches de cet organisme. De meme, l'utilisation de ces supports pour l'etude 
du polymorphisme genetique de souches proches de Streptococcus agalactiae CIP 
82.45 (ATCC 12403), en particulier par la determination des regions de colinearite, est 
tres utile dans la mesure ou ces supports fournissent non seulement la sequence 
10 nucleotidique du genome de Streptococcus agalactiae CIP 82.45 (ATCC 12403), mais 
egalement l'organisation genomique dans ladite sequence. Ainsi, les utilisations de 
supports d'enregistrement selon l'invention sont egalement des objets de l'invention. 

L' analyse d'homologie entre differentes sequences s'effectue en effet 
avantageusement a l'aide de logiciels de comparaison de sequences, tels le logiciel 
1 5 Blast, ou les logiciels de la trousse GCG, decrits precedemment. 

L'invention vise egalement les vecteurs de clonage et/ou d'expression, qui 
contiennent une sequence nucleotidique selon l'invention. 

Les vecteurs selon l'invention comportent de preference des elements qui 
permettent 1'expression et/ou la secretion des sequences nucleotidiques dans une cellule 
20 hote determinee. 

Le vecteur doit alors comporter un promoteur, des signaux d'initiation et de 
terminaison de la traduction, ainsi que des regions appropriees de regulation de la 
transcription. II doit pouvoir etre maintenu de facon stable dans la cellule hote et peut 
eventuellement posseder des signaux particuliers qui specifient la secretion de la 
25 proteine traduite. Ces differents elements sont choisis et optimises par rhomme du 
metier en fonction de l'hote cellulaire utilise. A cet effet, les sequences nucleotidiques 
selon l'invention peuvent etre inserees dans des vecteurs a replication autonome au sein 
de l'hote choisi, ou etre des vecteurs integratifs de l'hote choisi. 

De tels vecteurs sont prepares par des methodes couramment utilisees par 
30 l'homme du metier, et les clones resultant peuvent etre introduits dans un hote approprie 
par des methodes standards, telles que la lipofection, l'electroporation, le choc 
thermique, ou des methodes chimiques. 
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Les vecteurs selon l'invention sont par exemple des vecteurs d'origine 
plasmidique ou virale. lis sont utiles pour transformer des cellules notes afin de cloner 
ou d'exprimer les sequences nucleotidiques selon l'invention. 

L'invention comprend egalement les cellules notes transformees par un vecteur 
5 selon l'invention. 

L'hote cellulaire peut etre choisi parmi des systemes procaryotes ou eucaryotes, 
par exemple les cellules bacteriennes mais egalement les cellules de levure ou les 
cellules animates, en particulier les cellules de mammiferes. On peut egalement utiliser 
des cellules d'insectes ou des cellules de plantes. Les cellules notes preferees selon 
10 l'invention sont en particulier les cellules procaryotes, de preference les bacteries 
appartenant au genre Streptococcus, a Pespece Streptococcus agalactiae, plus 
particulierement Streptococcus agalactiae CIP 82.45 (ATCC 12403), ou les micro- 
organismes associes a Pespece Streptococcus agalactiae. 

L'invention concerne egalement les vegetaux et les animaux, excepte Phomme, 
15 qui comprennent une cellule transform^ selon l'invention. Les cellules transformees 
selon l'invention sont utilisables dans des procedes de preparation de polypeptides 
recombinants selon l'invention. Les procedes de preparation d'un polypeptide selon 
l'invention sous forme recombinante, caracterises en ce qu'ils mettent en ceuvre un 
vecteur et/ou une cellule transformee par un vecteur selon l'invention sont eux-memes 
20 compris dans la presente invention. De preference, on cultive une cellule transformee 
par un vecteur selon l'invention dans des conditions qui permettent l'expression dudit 
polypeptide et on recupere ledit peptide recombinant. 

Ainsi qu'il a ete dit, l'hote cellulaire peut etre choisi parmi des systemes 
procaryotes ou eucaryotes. En particulier, il est possible d'identifier des sequences 
25 nucleotidiques selon l'invention, facilitant la secretion dans un tel systeme procaryote 
ou eucaryote. Un vecteur selon l'invention portant une telle sequence peut done Stre 
avantageusement utilise pour la production de proteines recombinantes, destinees a etre 
secretees. En effet, la purification de ces proteines recombinantes d'interet sera facilitee 
par le fait qu'elles sont presentent dans le surnageant de la culture cellulaire plutot qu'a 
30 Pinterieur des cellules hotes. 

On peut egalement preparer les polypeptides selon l'invention par synthese 
chimique. Un tel procede de preparation est egalement un objet de l'invention. 
L'homme du metier connait les procedes de synthese chimique, par exemple les 
techniques mettant en oeuvre des phases solides (voir notamment Steward et al., 1984, 
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Solid phase peptides synthesis, Pierce Chem. Company, Rockford, 111, 2eme ed., 
(1984)) ou des techniques utilisant des phases solides partielles, par condensation de 
fragments ou par une synthese en solution classique. Les polypeptides obtenus par 
synthese chimique et pouvant comporter des acides amines non naturels correspondants 
5 sont egalement compris dans 1' invention. 

L' invention est en outre relative a des polypeptides hybrides presentant au moins 
un polypeptide ou un de ses fragments selon l'invention, et une sequence d'un 
polypeptide susceptible d'induire une reponse immunitaire chez l'homme ou r animal. 

Avantageusement, le determinant antigenique est tel qu'il est susceptible 
1 0 d'induire une reponse humorale et/ou cellulaire. 

Un tel determinant pourra comprendre un polypeptide ou un de ses fragments 
selon l'invention sous forme glycosylee, utilise en vue d'obtenir des compositions 
immunogenes susceptibles d'induire la synthese d'anticorps diriges contre des epitopes 
multiples. Lesdits polypeptides ou leurs fragments glycosyles font egalement partie de 
15 l'invention. 

Ces molecules hybrides peuvent etre constitutes en partie d'une molecule 
porteuse de polypeptides ou de leurs fragments selon l'invention, associee a une partie 
eventuellement immunogene, en particulier un epitope de la toxine diphterique, la 
toxine tetanique, un antigene de surface du virus de l'hepatite B (brevet FR 79 2181 1), 
20 1'antigene VP1 du virus de la poliomyelite ou toute autre toxine ou antigene viral ou 
bacterien. 

Les precedes de synthese des molecules hybrides englobent les methodes 
utilisees en genie genetique pour construire des sequences nucleotidiques hybrides 
codant pour les sequences polypeptidiques recherchees. On pourra, par exemple, se 
25 referer avantageusement a la technique d'obtention de genes codant pour des proteines 
de fusion decrite par Minton en 1984. 

Lesdites sequences nucleotidiques hybrides codant pour un polypeptide hybride 
ainsi que les polypeptides hybrides selon l'invention, caracterises en ce qu'il s'agit de 
polypeptides recombinants obtenus par 1'expression desdites sequences nucleotidiques 
30 hybrides, font egalement partie de l'invention. 

L'invention comprend egalement les vecteurs caracterises en ce qu'ils 
contiennent une desdites sequences nucleotidiques hybrides. Les cellules hotes 
transformees par lesdits vecteurs, les animaux transgeniques comprenant une desdites 
cellules transformees ainsi que les procedes de preparation de polypeptides 
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recombinants utilisant lesdits vecteurs, lesdites cellules transformees et/ou lesdits 
animaux transgeniques font egalement partie de l'invention. 

Le couplage entre un polypeptide selon l'invention et un polypeptide 
immunogene peut etre effectue par voie chimique, ou par voie biologique. Ainsi, selon 
5 l'invention, il est possible d'introduire un ou plusieurs element(s) de liaison, notamment 
des acides amines pour faciliter les reactions de couplage entre le polypeptide selon 
l'invention, et le polypeptide immunostimulateur, le couplage covalent de l'antigene 
immunostimulateur pouvant etre realise a l'extremite N ou C-terminale du polypeptide 
selon 1' invention. Les reactifs bifonctionnels permettant ce couplage sont determines en 

10 fonction de l'extremite choisie pour realiser ce couplage, et les techniques de couplage 
sont bien connues de l'homme du metier. 

Les conjugues issus d'un couplage de peptides peuvent etre egalement prepares 
par recombinaison genetique. Le peptide hybride (conjugue) peut en effet etre produit 
par des techniques d'ADN recombinant, par insertion ou addition a la sequence d'ADN 

15 codant pour le polypeptide selon l'invention, d'une sequence codant pour le ou les 
peptide(s) antigene(s), immunogene(s) ou haptene(s). Ces techniques de preparation de 
peptides hybrides par recombinaison genetique sont bien connues de Phomme du metier 
(voir par exemple Makrides, 1996, Microbiological Reviews 60, 5 12-538). 

De preference, ledit polypeptide immunitaire est choisi dans le groupe des 

20 peptides contenant les anatoxines, notamment le toxoi'de diphterique ou le toxoi'de 
tetanique, les proteines derivees du Streptocoque (comme la proteine de liaison a la 
seralbumine humaine), les proteines membranaires OMPA et les complexes de 
proteines de membranes externes, les vesicules de membranes externes ou les proteines 
de chocs thermiques. 

25 Les polypeptides hybrides selon l'invention sont tres utiles pour obtenir des 

anticorps monoclonaux ou polyclonaux, capables de reconnaitre specifiquement les 
polypeptides selon l'invention. En effet, un polypeptide hybride selon l'invention 
permet la potentialisation de la reponse immunitaire, contre le polypeptide selon 
l'invention couple a la molecule immunogene. De tels anticorps monoclonaux ou 

30 polyclonaux, leurs fragments, ou les anticorps chimeriques, reconnaissant les 
polypeptides selon l'invention, sont egalement objet de l'invention. 

Les anticorps monoclonaux specifiques peuvent etre obtenus selon la methode 
classique de culture d'hybridome decrite par Kohler et Milstein (1975, Nature 256, 
495). 
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Les anticorps selon 1' invention sont par exemple des anticorps chimeriques, des 
anticorps humanises, des fragments Fab, ou F(ab') 2 . lis peuvent egalement se presenter 
sous forme d'immunoconjugues ou d'anticorps marques afin d'obtenir un signal 
detectable et/ou quantifiable. 
5 Ainsi, les anticorps selon l'invention peuvent etre employes dans un procede' 

pour la detection et/ou 1' identification de bacteries appartenant a l'espece Streptococcus 
agalactiae ou a un micro-organisme associe dans un echantillon biologique, caracterise 
en ce qu'il comprend les etapes suivantes: 

a) mise en contact de l'echantillon biologique avec un anticorps selon l'invention ; 

10 b) mise en evidence du complexe antigene-anticorps eventuellement forme. 

Les anticorps selon la presente invention sont egalement utilisables afin de 
detecter une expression d'un gene de Streptococcus agalactiae ou de micro-organismes 
associes. En effet, la presence du produit d'expression d'un gene reconnu par un 
anticorps specifique dudit produit d'expression peut etre detectee par la presence d'un 

15 complexe antigene-anticorps forme apres la mise en contact de la souche de 
Streptococcus agalactiae ou du micro-organisme associe avec un anticorps selon 
l'invention. La souche bacterienne utilisee peut avoir ete « preparee », c'est-a-dire 
centrifugee, lysee, placee dans un reactif approprie pour la constitution du milieu 
propice a la reaction immunologique. En particulier, on prefere un procede de detection 

20 de l'expression dans le gene, correspondant a un Western blot, pouvant etre effectue 
apres une electrophorese sur gel de polyacrylamide d'un lysat de la souche bacterienne, 
en presence ou en l'absence de conditions reductrices (SDS-PAGE). Apres migration et 
separation des proteines sur le gel de polyacrylamide, on transfere lesdites proteines sur 
une membrane appropriee (par exemple en nylon) et on detecte la presence de la 

25 proteine ou du polypeptide d'interet, par mise en contact de ladite membrane avec un 
anticorps selon l'invention. 

Ainsi, la presente invention comprend egalement les kits ou necessaires pour la 
mise en ceuvre d'un procede tel que decrit (de detection de l'expression d'un gene de 
Streptococcus agalactiae ou d'un micro-organisme associe, ou pour la detection et/ou 

30 1' identification de bacteries appartenant a l'espece Streptococcus agalactiae ou un 
micro-organisme associe), comprenant les elements suivants : 

a) un anticorps polyclonal ou monoclonal selon l'invention ; 

b) eventuellement, les reactifs pour la constitution du milieu propice a la reaction 
immunologique ; 



WO 02/092818 



30 



PCTYIB02/03059 



c) eventuellement, les reactifs permettant la mise en evidence des complexes antigene- 
anticorps produits par la reaction immunologique. 

Les polypeptides et les anticorps selon 1' invention peuvent avantageusement etre 
immobilises sur un support, notamment une puce a proteines. Une telle puce a proteines 
5 est un objet de l'invention, et peut egalement contenir au moins un polypeptide d'un 
micro-organisme autre que Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un 
anticorps dirige contre un compose d'un micro-organisme autre que Streptococcus 
agalactiae CIP 82.45 (ATCC 12403). 

Les puces a proteines ou filtres a haute densite contenant des proteines selon 
10 l'invention peuvent etre construites de la meme maniere que les puces a ADN selon 
l'invention. En pratique, on peut effectuer la synthese des polypeptides directement 
fixes sur la puce a proteines, ou effectuer une synthese ex situ suivie d'une etape de 
fixation sur ladite puce du polypeptide synthetise. Cette derniere methode est preferable, 
lorsque Ton desire fixer des proteines de taille importante sur le support, ces proteines 
1 5 etant avantageusement preparees par genie genetique. Toutefois, si Ton ne desire fixer 
que des peptides sur le support de ladite puce, il peut etre plus interessant de proceder a 
la synthese desdits peptides directement in situ. 

Les puces a proteines selon l'invention peuvent etre avantageusement utilisees 
dans des kits ou necessaires pour la detection et/ou 1' identification de bacteries 
20 associees a l'espece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un micro- 
organisme, ou de facon plus generate dans des kits ou necessaires pour la detection 
et/ou 1' identification de micro-organismes. Lorsque Ton fixe les polypeptides selon 
l'invention sur les puces a ADN, on recherche la presence d'anticorps dans les 
echantillons testes, la fixation d'un anticorps selon l'invention sur le support de la puce 
25 a proteines permettant l' identification de la proteine dont ledit anticorps est specifique. 

De preference, on fixe un anticorps selon l'invention sur le support de la puce a 
proteines, et on detecte la presence de Pantigene correspondant, specifique de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou d'un micro-organisme associe. 

Une puce a proteines ci-dessus decrite peut etre utilisee pour la detection de 
30 produits de genes, pour etablir un profil d'expression desdits genes, en complement 
d'une puce a ADN selon l'invention. 

Les puces a proteines selon l'invention sont egalement extremement utiles pour 
les experiences de proteomique, qui etudie les interactions entre les differentes prolines 
d'un micro-organisme donne. De facon simplifiee, on fixe des peptides representatifs 
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des differentes proteines d'un organisme sur un support. Puis, on met ledit support en 
contact avec des proteines marquees, et apres une etape optionnelle de rincage, on 
detecte des interactions entre lesdites proteines marquees et les peptides fixes sur la 
puce a proteines. 

5 Ainsi, les puces a proteines comprenant une sequence polypeptidique selon 

l'invention ou un anticorps selon l'invention sont objet de l'invention, ainsi que les kits 
ou necessaires les contenant. 

La presente invention couvre egalement un precede de detection et/ou 
d' identification de bacteries appartenant a l'espece Streptococcus agalactiae CIP 82.45 
10 (ATCC 12403) ou a un micro-organisme associe dans un echantillon biologique, qui 
met en oeuvre une sequence nucleotidique selon l'invention. 

II doit etre entendu que le terme Echantillon biologique concerne dans la 
presente invention les echantillons preleves a partir d'un organisme vivant (en 
particulier sang, tissus, organes ou autres preleves a partir d'un mammifere) ou un 
1 5 echantillon contenant du materiel biologique, c'est-a-dire de 1' ADN ou de 1' ARN. Un 
tel echantillon biologique comprend aussi les compositions alimentaires contenant des 
bacteries (par exemple les fromages, les produits laitiers), mais egalement des 
compositions alimentaires contenant des levures (bieres, pains) ou autres. Le terme 
echantillon biologique concerne aussi les bacteries isolees a partir de ces pref evements 
20 ou compositions alimentaires. 

Le precede de detection et/ou d' identification mettant en ceuvre les sequences 
nucleotidiques selon l'invention peut etre de diverse nature. 

On prefere un precede comportant les etapes suivantes : 

a) eventuellement, isolement de l'ADN a partir de l'echantillon biologique a analyser, 
25 ou obtention d'un ADNc a partir de 1'ARN de l'echantillon biologique ; 

b) amplification specifique de l'ADN de bacteries appartenant a l'espece Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe a l'aide d'au 
moins une amorce selon l'invention ; 

c) mise en evidence des produits d'amplification. 
Ce precede est base sur 1' amplification specifique de l'ADN, en particulier par 

une reaction d'amplification en chaine. 

On prefere egalement un precede comprenant les etapes suivantes : 
a) mise en contact d'une sonde nucleotidique selon l'invention avec un echantillon 
biologique, l'acide nucleique contenu dans l'echantillon biologique ayant, le cas 
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echeant, prealablement ete rendu accessible a l'hybridation, dans des conditions 
permettant l'hybridation de la sonde a l'acide nucleique d'une bacterie appartenant a 
1'espece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un micro- 
organisme associe ; 

5 b) mise en evidence de l'hybride eventuellement forme entre la sonde nucleotidique et 
l'ADN de l'echantillon biologique. 

Un tel precede ne doit pas etre limite a la detection de la presence de l'ADN 
contenu dans l'echantillon biologique a tester, il peut etre egalement mis en oeuvre pour 
detecter l'ARN contenu dans ledit echantillon. Ce procede englobe en particulier les 
1 0 Southern et Northern blot. 

Un autre procede prefere selon 1' invention comprend les etapes suivantes : 

a) mise en contact d'une sonde nucleotidique immobilisee sur un support selon 
l'invention avec un echantillon biologique, l'acide nucleique de l'echantillon, ayant, 
le cas echeant, ete prealablement rendu accessible a l'hybridation, dans des 

15 conditions permettant l'hybridation de la sonde a l'acide nucleique d'une bacterie 
appartenant a 1'espece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un 
micro-organisme associe ; 

b) mise en contact de l'hybride forme entre la sonde nucleotidique immobilisee sur un 
support et l'acide nucleique contenu dans l'echantillon biologique, le cas echeant 

20 apres elimination de l'ADN de l'echantillon biologique n'ayant pas hybride avec la 
sonde, avec une sonde nucleotidique marquee selon l'invention ; 

c) mise en evidence du nouvel hybride forme a l'etape b). 
Ce procede est avantageusement utilise" avec une puce a ADN selon l'invention, 

l'acide nucleique recherche s'hybridant avec une sonde presente a la surface de ladite 
puce, et etant detecte par 1' utilisation d'une sonde marquee. Ce procede est 
avantageusement mis en ceuvre en combinant une etape pr^alable d' amplification de 
l'ADN ou de l'ADN complementaire obtenu eventuellement par transcription inverse, a 
l'aide d'amorces selon l'invention. 

Ainsi, la presente invention englobe egalement les kits ou necessaires pour la 
detection et/ou P identification de bacteries appartenant a 1'espece Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe, caracterise en ce 
qu'il comprend les elements suivants : 
a) une sonde nucleotidique selon l'invention ; 
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b) eventuellement, les reactifs necessaires a la mise en oeuvre d'une reaction 
d' hybridation ; 

c) eventuellement, au moins une amorce selon 1' invention ainsi que les reactifs 
necessaires a une reaction d'amplification de l'ADN. 

5 De meme, la presente invention englobe egalement les kits ou necessaires pour 

la detection et/ou l'identification de bacteries appartenant a l'espece Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe, caracterise en ce 
qu'il comprend les elements suivants : 

a) une sonde nucleotidique, dite sonde de capture, selon 1' invention ; 
10 b) une sonde oligonucleotidique, dite sonde de revelation, selon Pinvention ; 

c) eventuellement, au moins une amorce selon 1' invention ainsi que les reactifs 
necessaires a une reaction d'amplification de l'ADN. 

Enfin, les kits ou necessaires pour la detection et/ou l'identification de bacteries 
appartenant a l'espece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un 
1 5 micro-organisme associe, caracterise en ce qu'il comprend les elements suivants : 

a) au moins une amorce selon Pinvention ; 

b) eventuellement, les reactifs necessaires pour effectuer une reaction d'amplification 
d'ADN ; 

c) eventuellement, un composant permettant de verifier la sequence du fragment 
20 amplifie, plus particulierement une sonde oligonucleotidique selon Pinvention, 

sont egalement objet de la presente invention. 

De preference, lesdites amorces et/ou sondes et/ou polypeptides et/ou anticorps 
selon la presente invention utilises dans les precedes et/ou kits ou necessaires selon la 
presente invention sont choisis parmi les amorces et/ou sondes et/ou polypeptides et/ou 
25 anticorps specifiques de l'espece Streptococcus agalactiae CIP 82.45 (ATCC 12403). 
De maniere preferee, ces elements sont choisis parmi les sequences nucleotidiques 
codant pour une proteine secretee, parmi les polypeptides secretes, ou parmi les 
anticorps diriges contre des polypeptides secretes de Streptococcus agalactiae CIP 
82.45 (ATCC 12403). 

30 La presente invention a egalement pour objet les souches de Streptococcus 

agalactiae CIP 82.45 (ATCC 12403) et/ou de micro-organismes associes contenant une 
ou plusieurs mutation(s) dans une sequence nucleotidique selon Pinvention, en 
particulier une sequence ORF, ou lews Elements regulateurs (en particulier promoteurs). 
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On prefere, selon la presente invention, les souches de Streptococcus agalactiae 
CIP 82.45 (ATCC 12403) presentant une ou plusieurs mutation(s) dans les sequences 
nucleotidiques codant pour des polypeptides impliques dans la machinerie cellulaire, en 
particulier la secretion, le metabolisme intermediate central, le metabolisme 
5 energetique, les processus de synthese des acides amines, de transcription et de 
traduction, de synthese des polypeptides. 

Lesdites mutations peuvent mener a une inactivation du gene, ou en particulier 
lorsqu'elles sont situees dans les elements regulateurs dudit gene, a une surexpression 
de celui-ci. 

10 L' invention concerne en outre Putilisation d'une sequence nucleotidique selon 

l'invention, d'un polypeptide selon l'invention, d'un anticorps selon l'invention, d'une 
cellule selon l'invention, et/ou d'un animal transforme selon l'invention, pour la 
selection de compose organique ou inorganique capable de moduler, de reguler, 
d'induire ou d'inhiber l'expression de genes, et/ou de modifier la replication cellulaire 
15 de cellules eucaryotes ou procaryotes ou capables d'induire, d'inhiber ou d'aggraver 
une pathologies liees a une infection par Streptococcus agalactiae ou un de ses micro- 
organismes associes. 

L'invention comprend egalement une methode de selection de composes 
capables de se lier a un polypeptide ou un de ses fragments selon l'invention, capables 
20 de se lier a une sequence nucleotidique selon l'invention, ou capables de reconnaitre un 
anticorps selon l'invention, et/ou capables de moduler, de reguler, d'induire ou d'inhiber 
l'expression de genes, et/ou de modifier la croissance ou la replication cellulaire de 
cellules eucaryotes ou procaryotes, ou capables d'induire, d'inhiber ou d'aggraver chez 
un organisme animal ou humain une pathologie liee a une infection par Streptococcus, 
par exemple par Streptococcus agalactiae, ou un de ses micro-organismes associes, 
caracterisee en ce qu'elle comprend les etapes suivantes : 

a) mise en contact dudit compose avec ledit polypeptide, ladite sequence nucleotidique, 
avec une cellule transformee selon l'invention et/ou administration dudit compose a 
un animal transforme selon l'invention ; 

b) determination de la capacite dudit compose a se lier avec ledit polypeptide ou ladite 
sequence nucleotidique, ou de moduler, de reguler, d'induire ou d'inhiber 
l'expression de genes, ou de moduler la croissance ou la replication cellulaire, ou 
d'induire, d'inhiber ou d'aggraver chez ledit animal transforme les pathologies liees 
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a une infection par Streptococcus, par exemple Streptococcus agalactiae ou un de ses 
micro-organismes associes. 

Les cellules et/ou les animaux transformes selon l'invention, pourront 
avantageusement servir de modele et etre utilises dans des precedes pour etudier, 
5 identifier et/ou selectionner des composes susceptibles d'etre responsables de 
pathologies induites ou aggravees par Streptococcus agalactiae, ou susceptibles de 
prevenir et/ou de traiter ces pathologies. En particulier, les cellules hotes transformees, 
notamment les bacteries de la famille des Streptococcus dont la transformation par un 
vecteur selon l'invention peut par exemple accroitre ou inhiber son pouvoir infectieux, 
10 ou moduler les pathologies habituellement induites ou aggravees par l'infection, 
pourront etre utilisees pour infecter des animaux dont on suivra Papparition des 
pathologies. Ces animaux non transformes, infectes par exemple avec des bacteries 
Streptococcus transformees, pourront servir de modele d'etude. De la meme maniere, 
les animaux transformes selon l'invention pourront etre utilises dans des procedes de 
15 selection de composes susceptibles de prevenir et/ou de traiter les maladies dues a 
Streptococcus. Lesdits procedes utilisant lesdites cellules transformees et/ou animaux 
transformes, font partie de l'invention. 

Les composes susceptibles d'etre selectionnes peuvent etre des composes 
organiques tels que des polypeptides ou hydrates de carbone ou tous autres composes 
20 organiques ou inorganiques deja connus, ou des composes organiques nouveaux 
elabores a partir de techniques de modelisation moleculaire et obtenus par synthese 
chimique ou biochimique, ces techniques etant connues de l'homme de 1'art. 

Lesdits composes selectionnes pourront etre utilises pour moduler la croissance 
et/ou la replication cellulaire de Streptococcus agalactiae ou tout autre micro-organisme 
25 associe et ainsi pour controler l'infection par ces micro-organismes. Lesdits composes 
selon l'invention pourront egalement etre utilises pour moduler la croissance et/ou la 
replication cellulaire de toutes cellules eucaryotes ou procaryotes, notamment les 
cellules tumorales et les micro-organismes infectieux, pour lesquelles lesdits composes 
s'avereront actifs, les methodes permettant de determiner lesdites modulations etant 
30 bien connues de l'homme de 1'art. 

On entend designer par compose capable de moduler la croissance d'un micro- 
organisme tout compose permettant d'intervenir, de modifier, de limiter et/ou de reduire 
le developpement, la croissance, la vitesse de proliferation et/ou la viabilite dudit micro- 
organisme. 
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Cette modulation peut etre realisee par exemple par un agent capable de se Her a 
une proteine et ainsi d'inhiber ou de potentialiser son activite biologique, ou capable de 
se lier a une proteine membranaire de la surface exterieure d'un micro-organisme et de 
bloquer la penetration dudit micro-organisme dans la cellule hote ou de favoriser 
5 Taction du systeme irnrnunitaire de l'organisme infecte dirige a l'encontre dudit micro- 
organisme. Cette modulation peut Stre egalement realisee par un agent capable de se lier 
a une sequence nucleotidique d'un ADN ou ARN d'un micro-organisme et de bloquer 
par exemple l'expression d'un polypeptide dont 1'activite biologique ou structurelle est 
necessaire a la croissance ou a la reproduction dudit micro-organisme. 

10 On entend designer par micro-organisme associe dans la presente invention, tout 

micro-organisme dont l'expression de gene peut etre modulee, regulee, induite ou 
inhibee, ou dont la croissance ou la replication cellulaire peut etre egalement modulee 
par un compose de l'invention. On entend designer egalement par micro-organisme 
associe dans la presente invention, tout micro-organisme comportant des sequences 

15 nucleotidiques ou des polypeptides selon l'invention. Ces micro-organismes peuvent 
dans certains cas comporter des polypeptides ou des sequences nucleotidiques 
identiques ou homologues a celles de l'invention et pourront egalement etre detectes 
et/ou identifies par les procedes ou kit de detection et/ou d' identification selon 
l'invention et egalement servir de cible pour les composes de l'invention. On entend 

20 aussi designer par micro-organisme tout micro-organisme Streptococcus agalactiae de 
tout serotype. 

L'invention concerne les composes susceptibles d'etre selectionnes par une 
methode de selection selon l'invention. 

L'invention concerne egalement une composition pharmaceutique comprenant 
25 un compose choisi parmi les composes suivants : 

a) une sequence nucleotidique selon l'invention ; 

b) un polypeptide selon l'invention ; 

c) un vecteur selon l'invention ; 

d) un anticorps selon l'invention ; et 

30 e) un compose susceptible d'etre selectionne par une methode de selection selon 
l'invention, 

eventuellement en association avec un vehicule pharmaceutiquement acceptable. 
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La presente invention concerne en outre une composition pharmaceutique selon 
l'invention pour la prevention et le traitement d'une infection par une bacterie 
appartenant a l'espece Streptococcus agalactiae. 

La presente invention concerne en outre une composition pharmaceutique selon 
5 l'invention, caracterisee en ce qu'elle comprend des anticorps dirig^s contre les 
polypeptides specifiques de Streptococcus agalactiae. 

On entend designer par quantite efficace, une quantite suffisante dudit compose 
ou anticorps, ou de polypeptide de l'invention, permettant de moduler la croissance de 
Streptococcus agalactiae ou d'un micro-organisme associe. 
10 L'invention concerne aussi une composition pharmaceutique selon l'invention 

pour la prevention ou le traitement d'une infection par une bacterie appartenant au genre 
Streptococcus ou par un micro-organisme associe. 

L'invention vise en outre une composition immunogene et/ou vaccinale, 
caracterisee en ce qu'elle comprend un ou plusieurs polypeptides selon l'invention et/ou 
15 un ou plusieurs polypeptides hybrides selon l'invention. 

L'invention comprend aussi Putilisation d'une cellule transformee selon 
l'invention, pour la preparation d'une composition vaccinale. 

L'invention vise egalement une composition vaccinale, caracterisee en ce qu'elle 
contient une sequence nucleotidique selon l'invention, un vecteur selon l'invention 
20 et/ou une cellule transformee selon l'invention. 

L'invention concerne en outre une composition immunogene capable d'induire 
une reponse immunitaire cellulaire ou humorale pour la prevention ou le traitement 
d'une infection par une bacterie appartenant a l'espece Streptococcus agalactiae, 
caracterisee en ce qu'elle comprend une composition immunogene ou une composition 
25 vaccinale selon l'invention, en association avec un vehicule pharmaceutiquement 
acceptable et eventuellement un ou plusieurs adjuvants de l'immunite appropries. 

L'invention concerne egalement les compositions vaccinales selon l'invention, 
pour la prevention ou le traitement d'une infection par une bacterie appartenant au genre 
Streptococcus ou par un micro-organisme associe. 
30 De maniere preferee, les compositions immunogenes et/ou vaccinales selon 

l'invention destinees a la prevention et/ou au traitement d'infection par Streptococcus ou 
par un micro-organisme associe seront choisies parmi les compositions immunogenes 
et/ou vaccinales comprenant un polypeptide ou un de ses fragments correspondant a une 
proteine, ou un de ses fragments, de l'enveloppe cellulaire de Streptococcus. Les 



WO 02/092818 



PCT/IB02/03059 



compositions vaccinales comprenant des sequences nucleotidiques comprendront de 
preference egalement des sequences nucleotidiques codant pour un polypeptide ou un 
de ses fragments correspondant a une proteine, ou un de ses fragments, de l'enveloppe 
cellulaire de Streptococcus. 
5 Les polypeptides de l'invention ou leurs fragments entrant dans les compositions 

immunogenes selon l'invention peuvent Stre selectionnes par des techniques connues de 
rhomme de l'art comme par exemple sur la capacite desdits polypeptides a stimuler les 
cellules T, qui se traduit par exemple par leur proliferation ou la secretion 
d'interleukines, ou qui aboutit a la production d'anticorps diriges contre lesdits 
1 0 polypeptides. 

Chez la souris, chez laquelle une dose ponderale de la composition vaccinale 
comparable a la dose utilisee chez rhomme est administree, la reaction anticorps est 
testee par prelevement du serum suivi d'une £tude de la formation d'un complexe entre 
les anticorps presents dans le serum et 1'antigene de la composition vaccinale, selon les 
1 5 techniques usuelles. 

Selon l'invention, lesdites compositions vaccinales seront de preference en 
association avec un vehicule pharmaceutiquement acceptable et, le cas echeant, avec un 
ou plusieurs adjuvants de l'immunite appropries. 

Aujourd'hui, divers types de vaccins sont disponibles pour proteger rhomme 
20 contre des maladies infectieuses : micro-organismes vivants attenues (M bovis - BCG 
pour la tuberculose), micro-organismes inactives (virus de la grippe), des extraits 
acellulaires (Bordetella pertussis pour la coqueluche), proteines recombinees (antigene 
de surface du virus de 1' hepatite B), des polyosides (pneumocoques). Des vaccins 
prepares a partir de peptides de synthese ou de micro-organismes genetiquement 
modifies exprimant des antigenes heterologues sont en cours d'experimentation. Plus 
recemment encore, des ADNs plasmidiques recombines portant des genes codant pour 
des antigenes protecteurs ont et6 proposes comme strategic vaccinale alternative. Ce 
type de vaccination est realise avec un plasmide particulier derivant d'un plasmide de 
E. coli qui ne se replique pas in vivo et qui code uniquement pour la proteine vaccinante. 
Des animaux ont ete immunises en injectant simplement l'ADN plasmidique nu dans le 
muscle. Cette technique conduit a 1'expression de la proteine vaccinale in situ et a une 
reponse immunitaire de type cellulaire (CTL) et de type humoral (anticorps). Cette 
double induction de la reponse immunitaire est l'un des principaux avantages de la 
technique de vaccination avec de l'ADN nu. 
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Les compositions vaccinates comprenant des sequences nucleotidiques ou des 
vecteurs dans lesquels sont inserees lesdites sequences, sont notamment decrites dans la 
demande internationale N° WO 90/11092 et egalement dans la demande internationale 
N° WO 95/1 1307. 

5 La sequence nucleotidique constitutive de la composition vaccinale selon 

l'invention peut Stre injectee a Phote apres avoir ete couplee a des composes qui 
favorisent la penetration de ce polynucleotide a Pinterieur de la cellule ou son transport 
jusqu'au noyau cellulaire. Les conjugues resultants peuvent etre encapsules dans des 
microparticules polymeres, comme decrit dans la demande internationale N° WO 

1 0 94/27238 (Medisorb Technologies International). 

Selon un autre mode de realisation de la composition vaccinale selon 
l'invention, la sequence nucleotidique, de preference un ADN, est complexee avec du 
DEAE-dextran, avec des proteines nucleaires, avec des lipides ou encapsulee dans des 
liposomes ou encore introduite sous la forme d'un gel facilitant sa transfection dans les 

1 5 cellules. Le polynucleotide ou le vecteur selon l'invention peut aussi etre en suspension 
dans une solution tampon ou etre associe a des liposomes. 

Avantageusement, un tel vaccin sera prepare conformement a la technique 
decrite par Tacson et al. ou Huygen et al. en 1996 ou encore conformement a la 
technique decrite par Davis et al. dans la demande internationale N° WO 95/1 1307. 

20 Un tel vaccin peut etre egalement prepare sous la forme d'une composition 

contenant un vecteur selon l'invention, placee sous le controle d'elements de regulation 
permettant son expression chez l'homme ou l'animal. On pourra par exemple utiliser, en 
tant que vecteur d'expression in vivo de Pantigene polypeptidique d'interet, le plasmide 
pcDNA3 ou le plasmide pcDNAl/neo, tous les deux commercialises par Invitrogen (R 

25 & D Systems, Abingdon, Royaume-Uni). Un tel vaccin comprendra avantageusement, 
outre le vecteur recombinant, une solution saline, par exemple une solution de chlorure 
de sodium. 

On entend designer par vehicule pharmaceutiquement acceptable, un compose 
ou une combinaison de composes entrant dans une composition pharmaceutique ou 
30 vaccinale ne provoquant pas de reactions secondaires et qui permet par exemple la 
facilitation de l'administration du compose actif, l'augmentation de sa duree de vie et/ou 
de son efficacite dans l'organisme, l'augmentation de sa solubilite en solution ou encore 
P amelioration de sa conservation. Ces vehicules pharmaceutiquement acceptables sont 
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bien connus et seront adaptes par rhomme de Tart en fonction de la nature et du mode 
d'administration du compose actif choisi. 

En ce qui concerne les formulations vaccinales, celles-ci peuvent comprendre 
des adjuvants de l'immunite appropries qui sont connus de rhomme de l'art, comme par 
5 exemple l'hydroxyde d'aluminium, un representant de la famille des muramyl peptides 
comme un des denves peptidiques du N-acetyl-muramyl, un lysat bacterien, ou encore 
P adjuvant incomplet de Freund. 

De preference, ces composes seront administres par voie systemique, en 
particulier par voie intraveineuse, par voie intramusculaire, intradermique ou sous- 
10 cutanee, ou par voie orale. De maniere plus preferee, la composition vaccinale 
comprenant des polypeptides selon l'invention, sera administree a plusieurs reprises, de 
maniere etalee dans le temps, par voie intradermique ou sous-cutanee. 

Leurs modes d'administration, posologies et formes galeniques optimaux 
peuvent etre determines selon les criteres generalement pris en compte dans 
15 Petablissement d'un traitement adapte a un patient comme par exemple Page ou le 
poids corporel du patient, la gravite de son etat general, la tolerance au traitement et les 
effets secondaires constates. 

Enfin, l'invention comprend Putilisation d'une composition selon l'invention, 
pour le traitement ou la prevention de maladies induites ou aggravees par la presence de 
20 Streptococcus. 

Par ailleurs, la presente invention a egalement pour objet une banque d'ADN 
genomique d'une bacterie du genre Streptococcus, de maniere preferee, Streptococcus 
agalactiae, de maniere preferee la CIP 82.45 (ATCC 12403). 

La banque d'ADN genomique decrite dans la presente invention, en particulier 
25 la banque deposee a la CNCM le 28 decembre 2000 sous le numero d'ordre N° 1-2610, 
recouvre en effet Streptococcus agalactiae CIP 82.45 (ATCC 12403). Toutefois, si 
certaines regions n'ont pas pu etre clonees dans ladite banque, en raison de problemes 
de letaiites chez Escherichia coli, ces regions peuvent facilement etre amplifiees et 
identifiees par l'homme du metier, en utilisant des oligonucleotides specifiques des 
30 sequences des extremites des differents clones qui forment les contigs. 

La presente invention concerne egalement les methodes pour l'isolement d'un 
polynucleotide d'interet present chez une souche de Streptococcus agalactiae et absente 
chez une autre souche, qui utilise au moins une banque d'ADN basee par exemple sur 
un plasmide pSYX34 contenant un fragment du genome de Streptococcus agalactiae. 
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La methode selon l'invention pour l'isolement d'un polynucleotide d'interet peut 
comprendre les etapes suivantes : 

a) isoler au moins un polynucleotide contenu dans un clone de la banque d'ADN 
d'origine de Streptococcus agalactiae, 
5 b) isoler : 

- au moins un polynucleotide genomique ou ADNc d'une bacterie Streptococcus, 
ladite bacterie Streptococcus appartenant a une souche differente de la souche 
utilisee pour la construction de la banque d'ADN de l'etape a) ou, de facon 
alternative, 

10 - au moins un polynucleotide contenu dans un clone d'une banque d'ADN prepare a 
partir du genome d'une Streptococcus qui est differente de la souche Streptococcus 
agalactiae utilisee pour la construction de la banque d'ADN de l'etape a) ; 

c) hybrider le polynucleotide de l'etape a) au polynucleotide de l'etape b) ; 

d) selectionner les polynucleotides de l'etape a) qui n'ont pas forme de complexe 
1 5 d'hybridation avec les polynucleotides de l'etape b) ; 

e) caracteriser le polynucleotide selectionne. 

On peut preparer le polynucleotide de l'etape a) par la digestion d'au moins un 
clone recombinant avec une enzyme de restriction appropriee, et de facon optionnelle, 
^amplification de l'insert polynucleotide qui en resulte. 
20 Ainsi, la methode de l'invention permet a Phomme du metier d'effectuer des 

etudes genomiques comparatives entre les differentes souches ou especes du genre 
Streptococcus, par exemple entre les souches pathogeniques et leurs equivalents non 
pathogenes. 

En particulier, il est possible d'etudier et de determiner les regions de 
polymorphisme entre lesdites souches. 

L'invention comprend aussi un procede d'identification de sequence specifique 
de Streptococcus agalactiae, caracterise par l'alignement de sequences nucleotidiques 
de Streptococcus agalactiae selon l'invention et le traitement de donnees obtenues par 
cet alignement pour isoler les sequences specifiques. 

La presente invention concerne egalement Putilisation des sequences nucleiques 
ou des polypeptides selon la presente invention : 

- pour la secretion de proteines, 

- comme facteurs de virulence, 
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- pour le contrdle par l'intermediaire du quorum-sensing, 

- pour l'identification de cibles pour les maladies humaines dont Streptococcus 
agalactiae est un modele, et 

- pour l'identification de cibles contre les bacteries Gram positives pathogenes 
5 par la methode de genomique soustractive (comme par exemple par comparaison avec 

des bacteries Gram positives non pathogenes). 

EXEMPLES 

Exemple 1 : Materiels et methode 

10 La strategic de sequencage du genome de Streptococcus agalactiae CIP 82.45 

(ATCC 12403) repose sur un sequencage alleatoire (shot-gun). La premiere etape de ce 
travail consiste a doner l'ADN genomique de la bacterie Streptococcus agalactiae dans 
differents vecteurs (plasmides et BAC). 
Materiels et methodes. 

15 1 . Construction des banques : 

a/ Banque de petits fragments dans le vecteur pcDNA2.1 

L'ADN chromosomique de la souche de Streptococcus agalactiae CIP 
82.45 (ATCC 12403) a ete prepare par une methode classique incluant un traitement a 
la proteinase K et une extraction au phenol (9). Environ 10 ug dADN ont ete cassis par 

20 nebulisation (1 minute sous une pression de 1 bar) (4). Les extremites des fragments 
dADN ont ete rendues franches en faisant agir la DNA-polymerase du bacteriophage 
T4 pendant 15 minutes a 37°C en presence des 4 nucleotides tri-phosphate. L'enzyme a 
ete inactivee par une incubation de 15 mn a 75°C. Des adaptateurs (invitrogen Cat. 
N° 408-18) ont ensuite ete ligatures a ces extremites. Apres ligature, les fragments 

25 dADN chromosomiques ayant une taille entre 1 000 et 3 000 paires de bases ont ete 
purifies apres electrophorese sur gel d'agarose. Le vecteur utilise pour la construction de 
la banque, pcDNA2.1 (Invitrogen), a ete digere par 1'enzyme BstXl et purifie par 
geneclean (BIO- 101) apres electrophorese sur gel d'agarose. L'ADN chromosomique et 
le vecteur purifie ont ete ligatures par action de la ligase du bacteriophage T4. Le 

30 melange de ligation a ete introduit par transformation dans la souche <3! Escherichia coli 
XL2-blue (Stratagene). Environ 4000 colonies sont obtenues par pi du melange de 
ligation. 

b/ Construction d'une banque de fragments de taille moyenne (banque 
deposee a la CNCM sous le numero 1-2610) 
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Afin de limiter la frequence des evenements de co-ligation et de clones 
sans insert, la methode du remplissage partiel du site de coupure a ete utilisee (7). 

L'ADN chromosomique de la souche de Streptococcus agalactiae CIP 
82.45 (ATCC 12403) a ete digere de maniere partielle par l'enzyme de restriction 
5 Sau3A en utilisant une gamme de dilution de l'enzyme. La fraction presentant la gamme 
de tallies souhaitee (entre 2 et 12 kbases) a 6te precipitee et les extremites ont 6t6 
remplies partiellement par le fragment de Klenow de la DNA polymerase d'E. coli en 
presence de dTTP et dCTP. Apres purification sur gel d'agarose les fragments dADN 
chromosomique ayant une taille comprise entre 3 et 6 kbases ont ete ligues au vecteur 
1 0 pSYX34 (7) digere par l'enzyme Sail remplie partiellement par l'enzyme de Klenow en 
presence de dATP et dGTP. Le melange de ligation a ete introduit par transformation 
dans la souche 6! Escherichia coli XLlO-kan (Stratagene) et etalement sur milieu LB 
contenant du chloramphenicol a une concentration de 20 mg/1. Environ 500 colonies 
sont obtenues par ul du melange de ligation. 
15 2. Preparation des plasmides et sequencage 

Les plasmides ont ete prepares par une methode semi-automatique de 
preparation developpee au laboratoire GMP base sur la methode de lyse alcaline (2). 
Les inserts chromosomiques ont ete sequences a partir de leurs deux extremites en 
utilisant les primer T7 et universel en suivant les recommandations du fournisseur (PE- 
biosystems). Les sequences ont ete determinees en utilisant un sequenceur automatique 
de type 3700 (PE-Biosystem). 

3. Assemblage des sequences 
Les sequences ont ete assemblies en utilisant 1'ensemble de logiciel 

developpe a l'Universite de Washington, Phred, Phrap et Consed (5, 8). La finition de la 
sequence a ete realisee en utilisant 1'ensemble de logiciel GMPTB (7). L'etape de 
finition correspond au resequencage des regions ou la sequence est peu sure et le 
sequencage des regions situees entre les contigs. Elle a ete realisee en sequencant des 
produits de PCR correspondant a ces regions identifiees par un expert en utilisant les 
logiciels Consed (8) et GMPTB (7). Les sequences des oligonucleotides ont ete definies 
en utilisant les logiciels Consed et Primo (8, 10). 

4. Annotation des sequences 
L'identification des phases codantes (CDS) a ete realisee en utilisant 

1'ensemble de logiciel GMPTB (L. Frangeul et al. non publie). Ce programme combine 
les resultats de differentes methodes : (i) l'identification de phases ouvertes de lecture et 
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leur tri en fonction de leur taille, (ii) l'analyse de la probability d'etre codante en utilisant 
le logiciel Genemark (11), (iii) ['identification d'un debut de traduction (codon 
d'initiation et sequence de fixation du ribosome), (iv) similarite de la sequence proteique 
deduite avec les sequences proteiques contenues dans les banques de sequence en 
5 utilisant le logiciel BLASTP. 

Les fonctions des proteines codees par les phases codantes identifiees 
indiquees au tableau 1 ont ete predites par l'analyse des resultats de recherche de 
similarites dans les banques en utilisant le logiciel BLASTP (1). 

Exemple 2 : Description scientifique de la banque de BAC de Streptococcus agalactiae 
1 0 CIP 82.45 (ATCC 12403) deposee a la CNCM le 28 decembre 2000 sous le numero I- 
2610. 

Collection de clones $ Escherichia coli DH 10B™ (Calvin et al., J. Bacterid. 
170, 2796, 1988) contenant des fragments d'ADN genomique de la bacterie 
Streptococcus agalactiae souche NEM 316,CIP 82.45 (ATCC 12403) , clones dans le 

1 5 vecteur pSYX34 (Xu et al., Biotechniques, 17:57, 1990). Le vecteur a ete digere Sail et 
partiellement rempli a l'aide de l'ADN polymerase afin de produire des extremites 
5'-TC. Des fragments genomiques aleatoires de 3-6 kb provenant de Streptococcus 
agalactiae (souche NEM 316, CIP 82-45, ATCC 12403) ont ete digeres partiellement 
par Sau3A et partiellement remplis afin de produire des extremites 5'-GA. Apres 

20 ligature in vitro et transformation, des clones resistant au chloramphenicol ont ete 
selectionnes. Environ 5000 clones ont ete assembles, suspendus dans 1 5 ml de milieu L 
et congeles. 

Exemple 3 : Les proteines de surface de Streptococcus agalactiae NEM316 

Les proteines de surface des bacteries pathogenes, et plus particulierement les 

25 proteines dites du type LPXTG (Navarre et Schneewind, Microbial. Mol. Biol. Rev. 63 
174-229), jouent un role crucial lors du processus infectieux en permettant notamment 
des interactions entre le microorganisme et les cellules de l'hote et/ou 1'echappement au 
systeme immunitaire. Les inventeurs ont don focalise leur etude sur ce type de proteines 
qui presentent la particularite d'etre liees covalemment au peptidoglycane via le motif 

30 d'ancrage carboxylique LPXTG. Cette reaction est catalysee par une enzyme 
bifonctionnelle (endopeptidase-transpeptidase) appelee sortase. L'etude du role de ces 
proteines dans la virulence de S. agalactiae a ete realisee par 2 approches 
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complementaires (construction d'un mutant sortase-deficient, inactivation des genes 

codant pour des proteines de type LPXTG). 

- Le gene srtA de S. agalactiae NEM316 (IPF N°1268). 

Le mutant MEM1979, depose le 24 avril 2002 a la CNCM sous le numero I- 
5 2861, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
laquelle 1'IPF 1268 a 6te inactive. 

L'analyse du genome de NEM316 nous a permis de caracteriser un gene srtA 
presentant homologie respectivement 55 % et 30 % d'identite avec les sortases de 
Streptococcus gordonii et de Staphylococcus aureus. Ce gene a ete inactive par 
10 insertion-inactivation et nous avons montre que le mutant ainsi construit n'adherait plus 
a des cellules epitheliales humaines pulmonaires (A549) et uterines (HeLa). Ces 
resultats suggerent que les proteines du type LPXTG de S. agalactiae jouent un role 
dans la virulence de cette bacterie, en permettant notamment son adhesion avec les 
cellules de l'hote. 

15 - Recensement des proteines du type LPXTG de S. agalactiae NEM3 1 6. 

Une analyse in silico du genome de NEM316 a revele la presence de 30 
prolines de surface putatives possedant le motif d'ancrage de type LPXTG (Tableau 6). 
Nous avons etudie par amplification PCR, en utilisant des amorces specifiques, la 
distribution des genes codant pour 21 proteines du type LPXTG dans une collection de 

20 99 souches non-redondantes de S. agalactiae responsables d'infections non-invasives 
(70 souches provenant de portage ou d'infection urinaire) et invasives (29 souches 
provenant d'hemoculture ou de meningite). Cette etude a montre" que 6 de ces genes 
(IPN N° 1503, 678, 2192, 1861, 584, 280) etaient presents dans toutes les souches de 
notre echantillonnage (Tableau 7). Deux de ces six genes (IPF N°678 et 1503) ont ete 

25 inactives par insertion-inactivation et les mutants correspondants NEM2056 et 
NEM2057 presentaient une adherence diminuee avec les cellules epitheliales A549 
(Tableau 5). 

Le mutant NEM2056, depose le 24 avril 2002 a la CNCM sous le numero I- 

2862, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
30 laquelle 1'IPF 678 a ate inactive. 

Le mutant NEM2057, depose le 24 avril 2002 a la CNCM sous le numero I- 

2863, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
laquelle 1TPF 1503 a ete inactive. 



WO 02/092818 



46 



PCT/IB02/03059 



- Cibles vaccinales. 

La presence des genes IPF N°1503, 678, 2192, 1861, 584, 280 chez toutes les 
souches de S. agalactiae testees font des proteines correspondantes des cibles vaccinales 
de choix pour le developpement d'un vaccin anti-S. agalactiae. 

TABLEAU 1 : Liste des phases codantes annotees identifiees par l'analyse des 
sequences des contigs 



10 
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Blastp sur des banques de protelnes non 
/ Commentaires 


Identities = 129/202 (63%), Positives = 156/202 (76%), Gaps = 
8/202 (3%) ref|NP_072029.1| traG-related protein [Enterococcus 
faecalis] gb|AAG40447.1| (AE002565) traG-related protein 
[Enterococcus faecalis] Length = 423 




Identities = 220/354 (62%), Positives = 274/354 (77%), Gaps = 
1/354 (0%) sp|Q48677|PEPA_LACLC GLUTAMYL- 
AMINOPEPTIDASE emb|CAA56994.1| (X81089) glutamyl- 
aminopeptidase [Lactococcus lactis] Length = 355 






Identities = 49/100 (49%), Positives = 71/100 (71%), Gaps - 
4/100 (4%) dbj|BAB06972.1| (AP001518) thioredoxin H1 [Bacillus 
halodurans] Length = 106 


Identities = 79/196 (40%), Positives = 126/196 (63%), Gaps = 
1/196 (0%) pir||A69999 phenylalanyl-tRNA synthetase (beta 
subunit) homolog ytpR - Bacillus subtilis gb|AAC00291.1| 
(AF008220) YtpR [Bacillus subtilis] emb|CAB14960.1| (Z99119) 
similar to phenylalanyl-tRNA synthetase (beta subunit) 
[Bacillus subtilis] Length = 201 


Identities = 69/243 (28%), Positives = 117/243 (47%), Gaps = 
15/243 (6%) sp|Q02148|YHI6 LACLA HYPOTHETICAL 30.7 
KDA PROTEIN IN HISD-HISB INTERGENIC REGION (ORF6) 
pir||F45734 orf6 3 to hisD - Lactococcus lactis subsp. lactis 
gb|AAB81904.1| (U92974) unknown [Lactococcus lactis] 
Length = 263 


Resultats 1 
redondantes 
% Homologie 




No Hits found | 


m 


No Hits found | 


No Hits found | 


in 

CO 


o 

CD 




Localisation et sens sur 
con tig 


Contigl 37 (42738-43340 p) 


Contig137 (33454-33681 m) | 


Contig127 (13387-14454 p) 


Contig127 (12912-13202 p) \ 


Contig127 (12518-12802 m) I 


Contigl 27 (12198-12407 m) 


Contig127 (11539-12165 m) 


Contig127 (10769-1 1485 p) 


Prot No. 


SA-1 .2 


SA-1 0.1 I 


SA-1 000.1 


SA-1 001.1 | 


SA-1 002.1 | 


SA-1 003.1 


SA-1 004.1 


SA-1 006.1 


SEQ ID No. 


SeqID 140 


I SeqID 141 I 


SeqID 142 


SeqID 143 


I SeqID 144 I 


SeqID 145 


SeqID 146 


SeqID 147 
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Identities = 65/141 (46%), Positives = 93/141 (65%), Gaps = 
10/141 (7%) gb|AAF74079.1| (AF212845) putative single 
stranded binding protein [Lactococcus lactis bacteriophage 
ul36] Length = 141 


Identities = 201/279 (72%), Positives = 231/279 (82%) 
gb|AAC61484.1| (AF082738) ABC transporter ATP-binding 
protein [Streptococcus pyogenes] Length = 296 


Identities = 63/179 (35%), Positives = 91/179 (50%), Gaps = 
2/179 (1%) emb|CAC1 3072.1 1 (AL445503) putative hydrolase 
[Streptomyces coelicolor A3(2)] Length = 238 


Identities = 254/585 (43%), Positives = 371/585 (63%), Gaps = 
9/585 (1%) pir||A69655 two-component sensor histidine kinase 
lytS-involved - Bacillus subtilis emb|CAA99610.1| 
(Z75208) autolysin sensor kinase [Bacillus subtilis] 
emb|CAB1 4853.1 1 (Z991 18) two-component sensor histidine 
kinase [Bacillus subtilis] Length = 593 


Identities = 105/244 (43%), Positives = 157/244 (64%), Gaps = 
6/244 (2%) pir||B69655 two-component response regulator lytT- 
involved - Bacillus subtilis emb|CAA9961 1.1| (Z75208) autolysin 
response regulator [Bacillus subtilis] emb|CAB14852.1| (Z991 18) 
two-component response regulator [Bacillus subtilis] 
Length = 241 




Identities = 50/110 (45%), Positives = 82/110 (74%), Gaps = 
2/110 (1%) pir||C69983 conserved hypothetical protein ysbA - 
Bacillus subtilis emb|CAA99612.1| (Z75208) hypothetical protein 
[Bacillus subtilis] emb|CAB14851.1| (Z99118) similar to 
hypothetical proteins from B. subtilis [Bacillus subtilis] 
Length = 146 


CD 
CO 


a 


CO 
CO 


o 

CO 


CM 
CD 


No Hits found 


in 


Contig127 (10293-10688 m) 


Contig131 (21108-21947 p) 


Contig127 (9526-10170 m) 


Contig127 (7754-9499 m) 


Contig127 (7033-7779 m) 
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Contig127 (6936-7100 p) 
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in 


SeqID 1 
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SeqID ' 




SeqID 


SeolD 


SeqID 
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Identities = 120/240 (50%), Positives = 159/240 (66%), Gaps = 
10/240 (4%) pir||D69983 conserved hypothetical protein ysbB - 
Bacillus subtilis emb|CAA99613.1| (Z75208) hypothetical protein 
[Bacillus subtilis] emb|CAB14850.1| (Z99118) similar to 
hypothetical proteins [Bacillus subtilis] Length = 231 


Identities = 498/542 (91%), Positives = 518/542 (94%) 
gb|AAC67217.1| (U78968) surface lipoprotein DppA 
[Streptococcus pyogenes] Length = 542 


Identities = 302/325 (92%), Positives = 317/325 (96%) 
gb|AAC67218.1| (U78968) transmembrane transport protein 
DppB [Streptococcus pyogenes] Length = 325 


Identities = 119/165 (72%), Positives = 134/165 (81%), Gaps = 
5/165 (3%) gb|AAC61483.1| (AF082738) 
phosphotidylglycerophosphate synthase [Streptococcus 
pyogenes] Length = 165 


Identities = 255/274 (93%), Positives = 263/274 (95%), Gaps = 
1/274 (0%) gb|AAC67219.1| (U78968) transmembrane transport 
protein DppC [Streptococcus pyogenes] Length = 
274 


Identities = 254/267 (95%), Positives = 262/267 (97%) 
gb|AAC67220.1| (U78968) ATPase protein DppD [Streptococcus 
pyogenes] Length = 267 


Identities = 185/205 (90%), Positives = 195/205 (94%) 
gb|AAC67221.1| (U78968) ATPase protein DppE [Streptococcus 
pyogenesl Length = 208 
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Identities = 35/58 (60%), Positives = 44/58 (75%) 
sp|P36672|PTTB ECOLI PTS SYSTEM, TREHALOSE- 
SPECIFIC IIBC COMPONENT (EllBC-TRE) (TREHALOSE 
PERMEASE IIBC COMPONENT) (PHOSPHOTRANSFERASE 

ENZYME II, BC COMPONENT) (Ell-TRE) pir||C65236 
phosphotransferase system trehalose permease - Escherichia 
coli (strain K-12) gb|AAC77197.1| (AE000495) PTS 
system enzyme II, trehalose specific [Escherichia coli K12] 
Length = 473 




Identities = 37/124 (29%), Positives = 67/124 (53%), Gaps = 
2/124 (1%) gb|AAC98903.1| (AF023181) DivIC homolog [Listeria 
monocytogenes] Length = 128 


Identities - 49/84 (58%), Positives = 70/84 (83%) 
sp|P37557|YABO_BACSU HYPOTHETICAL 9.7 KDA PROTEIN 
IN MFD-DIVIC INTERGENIC REGION pir||S66089 conserved 
hypothetical protein yabO - Bacillus subtilis dbj|BAA05294.l| 
(D26185) unknown [Bacillus subtilis] emb|CAB1 1835.1 1 (Z991 04) 
similar to hypothetical proteins [Bacillus subtilis] Length = 
86 


Identities = 523/1051 (49%), Positives = 733/1051 (68%), Gaps = 
20/1051 (1%) gb|AAD03810.1| (AF054624) transcription-repair 
coupling factor [Lactobacillus sakei] Length = 1045 


Identities = 89/187 (47%), Positives = 127/187 (67%), Gaps = 
2/187 (1%) dbj|BAB03787.1| (AP001507) stage V spoliation 
protein C (peptidyl-tRNA hydrolase) [Bacillus halodurans] 
Length = 185 


Identities = 207/424 (48%), Positives = 277/424 (64%), Gaps = 
3/424 (0%) gb|AAC61481.1| (AF082738) unknown 
[Streptococcus pyogenes] Length = 429 
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Identities = 242/417 (58%), Positives = 308/417 (73%), Gaps = 

7/417 (1%) sp|Q9WZH9|GLYA_THEMA SERINE 
HYDROXYMETHYLTRANSFERASE (SERINE METHYLASE) 
(SHMT) pir||F72341 glycine hydroxymethyltransferase (EC 
2.1 .2.1 ) - Thermotoga maritima (strain MSB8) 
gb|AAD35802.1|AE001743_4 (AE001743) serine 
hydroxymethyltransferase [Thermotoga maritima] Length = 
427 


Identities = 32/95 (33%), Positives = 53/95 (55%), Gaps = 1/95 
(1%) emb|CAB71302.1| (AJ1 30879) hypothetical protein 
[Clostridium sticklandii] Length = 95 


Identities = 53/140 (37%), Positives = 78/140 (54%), Gaps = 
2/140 (1%) pir||F69900 hypothetical protein yocA [imported] - 

Bacillus subtilis gb|AAB84433.1| (AF027868) RAS-related 
protein [Bacillus subtilis] emb|CAB1 3805.1 1 (Z99114) similar to 
transposon-reiated protein [Bacillus subtilis] Length = 225 


Identities = 196/570 (34%), Positives = 327/570 (56%), Gaps = 
5/570 (0%) pir||E72396 ABC transporter, ATP-binding protein - 

Thermotoga maritima (strain MSB8) 
gb|AAD35375.1|AE001710_10 (AE001710) ABC transporter, 
ATP-binding protein [Thermotoga maritima] Length 
= 577 


Identities = 219/552 (39%), Positives = 337/552 (60%), Gaps = 
3/552 (0%) sp|Q9WYC4|Y288_THEMA HYPOTHETICAL ABC 
TRANSPORTER ATP-BINDING PROTEIN TM0288 pir||F72396 

ABC transporter, ATP-binding protein - Thermotoga maritima 
(strain MSB8) gb|AAD35376.1|AE001710_11 (AE001710) 
ABC transporter, ATP-binding protein [Thermotoga 
maritima] Length = 598 
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Identities = 461/493 (93%), Positives = 478/493 (96%) 
sp|P50099|lMDH_STRPY INOSINE-5 -MONOPHOSPHATE 
DEHYDROGENASE (IMP DEHYDROGENASE) (IMPDH) 
(IMPD) pir||JC4372 IMP dehydrogenase (EC 1.1.1.205) - 
Streptococcus pyogenes gb|AAB03846.1| (U26056) inosine 
monophosphate dehydrogenase [Streptococcus 
pyogenes] Length = 493 


Identities = 42/102 (41%), Positives = 70/102 (68%) 
gb|AAA23551.1| (M93570) PTS enzyme III eel [Escherichia coli] 
Length = 116 


Identities = 98/309 (31%), Positives = 178/309 (56%), Gaps = 
1/309 (0%) dbj|BAB04499.1| (AP001509) transcriptional regulator 
[Bacillus halodurans] Length = 316 


Identities = 96/243 (39%), Positives = 148/243 (60%), Gaps = 
1/243 (0%) sp|P76034|YCIT ECOLI HYPOTHETICAL 
TRANSCRIPTIONAL REGULATOR IN OSMB-RNB 
INTERGENIC REGION pir||G64876 hypothetical protein 
b1284 - Escherichia coli gb|AAC74366.1| (AE000226) putative 
DEOR-type transcriptional regulator [Escherichia coli K12] 
Length = 249 


Identities = 106/289 (36%), Positives = 146/289 (49%), Gaps = 
50/289 (17%) sp|P75794|PFLE ECOLI PUTATIVE PYRUVATE 

FORMATE-LYASE 3 ACTIVATING ENZYME pir||H64819 
probable pyruvate formate-lyase activating enzyme (EC 1.97.1.4) 
3 - Escherichia coli gb|AAC7391 1 .1 1 (AE0001 84) putative 
pyruvate formate-lyase 2 activating enzyme [Escherichia 
coli K12] dbj|BAA35512.1| (D90720) Iron-dependent pyruvate 
formate-lyase-activating enzyme [Escherichia coli] 
Length = 308 
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Identities = 132/293 (45%), Positives = 176/293 (60%), Gaps = 
4/293 (1%) sp|P36945|RBSK_BACSU RIBOKINASE pir||D69690 
ribokinase (EC 2.7.1.15) - Bacillus subtilis emb|CAB07465.1| 
(Z92953) ribokinase [Bacillus subtilis] emb|CAB15609.1| 
(Z99122) ribokinase [Bacillus subtilis] Length = 293 


Identities = 74/131 (56%), Positives = 96/131 (72%), Gaps = 
1/131 (0%) sp|P36946|RBSD_BACSU HIGH AFFINITY RIBOSE 
TRANSPORT PROTEIN RBSD pir||l40464 ribose ABC 
transporter (membrane protein) rbsD - Bacillus subtilis 
emb|CAA81050.1| (Z25798) Membrane Ribose Binding Protein 

[Bacillus subtilis] emb|CAB07464.1| (Z92953) membrane 
transport protein [Bacillus subtilis] emb|CAB15610.1| (Z99122) 
ribose ABC transporter (membrane protein) [Bacillus 
subtilis] Length = 131 


Identities = 298/493 (60%), Positives = 377/493 (76%), Gaps = 
1/493 (0%) sp|P36947|RBSA_BACSU RIBOSE TRANSPORT 

ATP-BINDING PROTEIN RBSA pir||H69689 ribose ABC 
transporter (ATP-binding protein) rbsA - Bacillus subtilis 
emb|CAB07463.1| (Z92953) ATP-binding transport protein 
[Bacillus subtilis] emb|CAB15611.1| (Z99122) ribose ABC 
transporter (ATP-binding protein) [Bacillus subtilis] 
Length = 493 


Identities = 198/305 (64%), Positives = 252/305 (81%), Gaps = 
1/305 (0%) pir||B69690 ribose ABC transporter (permease) rbsC - 
Bacillus subtilis emb|CAB07462.1| (Z92953) membrane transport 
protein [Bacillus subtilis] emb|CAB15612.1| (Z99122) ribose ABC 
transporter (permease) [Bacillus subtilis] Length = 322 
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Identities = 143/301 (47%), Positives = 204/301 (67%), Gaps = 
1/301 (0%) sp|P36949|RBSB_BACSU D-RIBOSE-BINDING 
PROTEIN PRECURSOR pir||A69690 ribose ABC transporter 
(ribose-binding protein) rbsB - Bacillus subtilis 
emb|CAB07461.1| (Z92953) periplasmic substrate-binding protein 
[Bacillus subtilis] emb|CAB15613.1| (Z99122) ribose ABC 
transporter (ribose-binding protein) [Bacillus subtilis] 
Length = 305 


Identities = 42/132 (31%), Positives = 74/132 (55%), Gaps = 
3/132 (2%) pir||H83123 hypothetical protein PA4181 [imported] - 

Pseudomonas aeruginosa (strain PA01) 
gb|MG07568.1|AE004834_8 (AE004834) hypothetical protein 

[Pseudomonas aeruginosa] Length = 239 


Identities = 273/491 (55%), Positives = 353/491 (71%), Gaps = 
19/491 (3%) sp|P22250|SYE_BACSU GLUTAMYL-TRNA 
SYNTHETASE (GLUTAMATE-TRNA LIGASE) (GLURS) 
pir||SYBSET glutamate-tRNA ligase (EC 6.1.1.17) gltX - Bacillus 
subtilis gb|AAA22495.1| (M55073) transfer RNA-GIn synthetase 

[Bacillus subtilis] gb|AAA21 796.1 1 (L14580) glutamyl-tRNA 
synthetase [Bacillus subtilis] dbj|BAA05326.1| (D26185) glutamyl- 
tRNA synthetase [Bacillus subtilis] emb|CAB11868.1| (Z99104) 
glutamyl-tRNA synthetase [Bacillus subtilis] gb|AAC31971.1| 
(U49789) glutamyl-tRNA synthetase [Bacillus subtilis] 
Length = 483 


Identities = 201/443 (45%), Positives = 290/443 (65%) 
sp|P77212|YKGC ECOLI PROBABLE PYRIDINE NUCLEOTIDE- 
DISULFIDE OXIDOREDUCTASE IN EAEH-BETA 
INTERGENIC REGION pir||H64756 probable mercury(ll) 
reductase (EC 1.16.1.1) - Escherichia coli gb|AAB18031.1| 
(U73857) similar to S. aureus mercury(ll) reductase [Escherichia 
coli] gb|AAC73407.1| (AE000137) putative oxidoreductase 
[Escherichia coli K12] Length = 450 
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' Identities = 95/382 (24%), Positives = 174/382 (44%), Gaps = 

Pyrococcus abyssi (strain Orsay) emb|CAB50057.1| 

abyssi] Length = 372 

Identities = 101/327 (30%), Positives = 169/327 (50%), Gaps = 
12/327 (3%) pir||T50594 probable oxidoreductase [imported] - 


I 


tjiiiu|o/v^ i^o/ a. i| (Mj^yjao; ongopeptiaase [Streptococcus 
thermophilus] Length = 631 
Identities = 66/1 14 (57%), Positives = 85/1 14 (73%) 
sp|P16963|YSA1_STRPY HYPOTHETICAL 16.6 KD PROTEIN 
IN SAGP 3 REGION pir||JE0061 hypothetical 16.5K protein 

(SAGP 5 region) - Streptococcus pyogenes 
dbj|BAA02939.1| (D13790) ORF2 [Streptococcus pyogenes] 


Identities = 133/309 (43%), Positives = 197/309 (63%), Gaps = 
5/309 (1%) sp|O35046|YOCD BACSU HYPOTHETICAL 36.4 

KDA PROTEIN IN CSAA-DES INTERGENIC REGION 
pir||A69901 immunity to bacteriotoxins homolog yocD - Bacillus 

subtilis gb[AAB84435.1| (AF027868) YocD [Bacillus subtilis] 
emb|CAB1 3809.1 1 (Z99114) similar to immunity to bacteriotoxins 
[Bacillus subtilis] Length = 325 
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Identities = 520/568 (91%), Positives = 547/568 (95%), Gaps = 
1/568 (0%) sp|P23531|PTLB_LACLA PTS SYSTEM, LACTOSE- 
SPECIFIC IIBC COMPONENT (EIIBC-LAC) (LACTOSE- 
PERMEASE IIBC COMPONENT) (PHOSPHOTRANSFERASE 
ENZYME II, BC COMPONENT) (Ell-LAC) pir||B23696 
phosphotransferase system enzyme II (EC 2.7.1.69) - 
Lactococcus lactis gb|AAA25182.1| (M60447) enzyme III 
[Lactococcus lactis] Length = 568 




Identities = 89/105 (84%), Positives = 97/105 (91%) 
sp|P23532|PTLA_LACLA PTS SYSTEM, LACTOSE-SPECIFIC 
IIA COMPONENT (EIIA-LAC) (LACTOSE-PERMEASE IIA 
COMPONENT) (PHOSPHOTRANSFERASE ENZYME II, 
A COMPONENT) (Elll-LAC) pir||A23696 phosphotransferase 

system enzyme III (EC 2.7.-.-) - Lactococcus lactis 
pdb|1E2A|A Chain A, Enzyme lia From The Lactose Specific Pts 
From Lactococcus Lactis pdb|1E2A|B Chain B, Enzyme 
lia From The Lactose Specific Pts From Lactococcus 
Lactis pdb|1E2A|C Chain C, Enzyme lia From The Lactose 
Specific Pts From Lactococcus Lactis gb|AAA25181.1| 
(M60447) enzyme III [Lactococcus lactis] Length = 105 


Identities = 104/278 (37%), Positives = 169/278 (60%), Gaps = 

1/278 (0%) sp|P24401|LACT_LACCA TRANSCRIPTION 
ANTITERMINATOR LACT emb|CAB02555.1| (Z80834) LacT 
[Lactobacillus casei] gb|AAB49331.1| (U21391) LacT 
[Lactobacillus casei] Length = 292 
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19/319 (77%), Gaps = 
acetoin dehydrogenase 
acillus halodurans] 


37 (51%) pir||G72548 
jm pernix (strain K1) 
3 hypothetical protein 
igth = 1 55 


14/317(66%), Gaps = 
acetoin dehydrogenase 
lacillus halodurans] 


38/641 (75%), Gaps = 
_3 (AE006339) ABC 
;us lactis subsp. 
335 




















1 6/406 (52%), Gaps = 
SpaA=endocarditis 
us sobrinus, 
Length = 1566 


Identities = 189/319 (59%), Positives = 2< 
1/319 (0%) dbj|BAB04496.1| (AP001509) i 
(TPP-dependent) beta chain [B 
Length = 327 


Identities = 45/97 (46%), Positives = 50/5 
hypothetical protein APE1675 - Aeropyn 
dbj|BAA80676.1| (AP000062) 155aa lon< 
[Aeropyrum pernix] Ler 


' (46%), Positives = 2' 
)4495.1| (AP001 509) i 
) alpha chain [E 
Length = 326 


(61%), Positives = 4i 
\K05160.1|AE006339 
ling protein [Lactococc 
actis] Length = i 




















» (38%), Positives = 2' 
AB30711.1|(S70345) 
: antigen [Streptococc 
3 eptide, 1566 aa] 


Identities = 148/317 
1/317(0%) dbj|BABC 
(TPP-dependent' 


Identities = 397/641 
17/641 (2%)gb|A> 
transporter ATP bind 




















Identities = 157/406 
28/406 (6%) gb|A 
immunodominant 
MUCOB 263, I 
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Identities = 90/201 (44%), Positives = 144/201 (70%), Gaps = 
5/201 (2%) sp|P37872|YBXB_BACSU HYPOTHETICAL 22.5 
KDA PROTEIN IN RPLL-RPOB INTERGENIC REGION (P23) 
(ORF23) pir||F69751 conserved hypothetical protein ybxB - 
Bacillus subtilis gb|AAB00971.1| (L24376) hypothetical protein 
[Bacillus subtilis] emb|CAB11882.1| (Z99104) alternate gene 
I name: ybaA~similar to hypothetical proteins [Bacillus 
subtilis] Length = 201 


Identities = 140/307 (45%), Positives = 203/307 (65%), Gaps = 
5/307 (1%) sp|Q9K8X7|COAA_BACHD PANTOTHENATE 
KINASE (PANTOTHENIC ACID KINASE) dbj|BAB06594.1| 
(AP001516) pantothenate kinase [Bacillus halodurans] 
Length = 316 


Identities = 47/86 (54%), Positives = 59/86 (67%), Gaps = 7/86 
(8%) dbj|BAB05058.1| (AP001511) ribosomal protein S20 (BS20) 
[Bacillus halodurans] Length = 91 


Identities = 170/269 (63%), Positives = 203/269 (75%), Gaps = 
2/269 (0%) gb|AAC35851.1| (AF086736) amino acid-binding 
protein Abp [Streptococcus uberis] Length = 277 .. 


Identities = 94/210 (44%), Positives = 145/210 (68%), Gaps = 
3/210 (1%) gb]AAB49429.1| (U731 11) glutamine transport ATP- 
binding protein GLNQ [Salmonella typhimurium] 
Length = 240 


Identities = 54/125 (43%), Positives = 82/125 (65%), Gaps = 
1/125 (0%) dbj|BAA98402.1| (AP002545) ABC amino acid 
transporter permease [Chlamydophila pneumoniae] 
Length = 217 


Identities = 60/268 (22%), Positives = 107/268 (39%), Gaps = 
42/268 (15%) gb|AAG44891.1|AF286595_1 (AF286595) flavin- 
containing monooxygenase FM03 [Rattus norvegicus] 
Length = 531 
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Identities = 101/318 (31%), Positives = 184/318 (57%), Gaps = 
5/318 (1%) sp|P31114|HEP2_BACSU HEPTAPRENYL 
DIPHOSPHATE SYNTHASE COMPONENT II (HEPPP 
SYNTHASE SUBUNIT 2) (SPORE GERMINATION 
PROTEIN C3) pir||E69630 heptaprenyl diphosphate synthase 
component II gerCC - Bacillus subtilis gb|AAA20856.1| 
(M80245) GerC3 [Bacillus subtilis] emb|CAB14190.1| (Z99115) 
heptaprenyl diphosphate synthase component II [Bacillus 
subtilis] Length = 348 


Identities = 264/577 (45%), Positives = 391/577 (67%), Gaps = 
14/577 (2%) sp|P94367|CYDD_BACSU TRANSPORT ATP- 
BINDING PROTEIN CYDD pir||D69611 ABC transporter required 
for expression of cytochrome bd (ATP-) cydD - Bacillus 
subtilis dbj | BAA1 1730.1| (D83026) homologous to many ATP- 
binding transport proteins; hypothetical [Bacillus subtilis] 
emb|CAB15899.1| (Z99123) ABC membrane transporter (ATP- 
binding protein) [Bacillus subtilis] Length = 575 


Identities = 278/569 (48%), Positives = 399/569 (69%), Gaps = 
6/569 (1%) sp|P94366|CYDC_BACSU TRANSPORT ATP- ■ 
BINDING PROTEIN CYDC pir||C69611 ABC transporter required 
for expression of cytochrome bd (ATP-) cydC - Bacillus 
subtilis dbj|BAA1 1729.1 1 (D83026) homologous to many ATP- 

binding transport proteins including 
SwissProt:CYDD_ECOLI; hypothetical [Bacillus subtilis] 
emb|CAB1 5900.1 1 (Z99123) ABC membrane transporter (ATP- 
binding protein) [Bacillus subtilis] Length = 567 
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identities = 158/331 (47%), Positives = 223/331 (66%), Gaps = 

1/331 (0%) sp|P94365|CYDB BACSU CYTOCHROME D 
UBIQUINOL OXIDASE SUBUNIT II pir||B69611 cytochrome d 
ubiquinol oxidase (EC 1.10.3.-) chain II cydB - Bacillus 
subtilis dbj|BAA1 1728.1 1 (D83026) homologous to cytochrome d 
ubiquinol oxidase subunit II; hypothetical [Bacillus subtilis] 
emb|CAB15901.1| (Z99123) cytochrome bd ubiquinol oxidase 
(subunit II) [Bacillus subtilis] Length = 338 


Identities = 246/470 (52%), Positives = 319/470 (67%), Gaps = 

12/470 (2%) sp|P94364|CYDA_BACSU CYTOCHROME D 
UBIQUINOL OXIDASE SUBUNIT I pir||A69611 cytochrome bd 
ubiquinol oxidase (subunit I) cydA - Bacillus subtilis 
dbj|BAA11727.1| (D83026) homologous to cytochrome d 
ubiquinol oxidase subunit I; hypothetical [Bacillus subtilis] 
emb|CAB1 5902.1 1 (Z99123) cytochrome bd ubiquinol oxidase 
(subunit I) [Bacillus subtilis] Length = 468 


Identities = 178/403 (44%), Positives = 249/403 (61%), Gaps = 
7/403 (1%) pir||A70015 probable NADH dehydrogenase (EC 
1.6.99.3) yumB - Bacillus subtilis emb|CAB07953.1| (Z93939) 
unknown [Bacillus subtilis] emb|CAB15200.1| (Z99120) similar to 
NADH dehydrogenase [Bacillus subtilis] Length = 406 
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Identities = 134/235 (57%), Positives = 170/235 (72%), Gaps = 
4/235 (1%)sp|031751|UPPS BACSU UNDECAPRENYL 
PYROPHOSPHATE SYNTHETASE (UPP SYNTHETASE) 
(DI-TRANS-POLY-CIS-DECAPRENYLCISTRANSFERASE) 
(UNDECAPRENYL DIPHOSPHATE SYNTHASE) (UDS) 


emb|CAB1 3526.1| (Z99112) similar to hypothetical proteins 
[Bacillus subtilis] Length = 260 


Identities = 289/478 (60%), Positives = 368/478 (76%), Gaps = 
2/478 (0%) gb|AAA69226.1| (U29579) 6-phospho-beta- 
glucosidase [Escherichia coli] Length = 476 


Identities = 43/177 (24%), Positives = 84/177 (47%), Gaps = 
9/177 (5%) sp|035264|PA1B_RAT PLATELET-ACTIVATING 

FACTOR ACETYLHYDROLASE IB BETA SUBUNIT (PAF 
ACETYLHYDROLASE 30 KDA SUBUNIT) (PAF-AH 30 KDA 
SUBUNIT) (PAF-AH BETA SUBUNIT) (PAFAH BETA 

SUBUNIT) (PLATELET-ACTIVATING FACTOR 
ACETYLHYDROLASE ALPHA 2 SUBUNIT) (PAF-AH 
ALPHA 2) gb|AAC27974.1| (AF016048) platelet-activating factor 
acetylhydrolase alpha 2 subunit [Rattus norvegicus] 


Identities = 103/265 (38%), Positives = 154/265 (57%), Gaps = 
4/265 (1%) sp|P75809|YBJI ECOLI PROTEIN YBJI Length 
! =271 


Identities = 197/296 (66%), Positives = 240/296 (80%) 
gb|AAF89977.1|AF206272_3 (AF206272) transcriptional 
regulator [Streptococcus mutans] Length = 301 


Identities = 141/443 (31%), Positives = 241/443 (53%), Gaps = 

20/443 (4%) pir||C82449 conserved hypothetical protein 
VCA0526 [imported] - Vibrio cholerae (group 01 strain 
N16961) gb|AAF96429.1| (AE004383) conserved hypothetical 
protein [Vibrio cholerae] Length = 468 
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Identities = 131/336 (38%), Positives = 188/336 (54%), Gaps = 
7/336(2%)sp|P23861|POTD ECOLI 
SPERMIDINE/PUTRESCINE-BINDING PERIPLASMIC 
PROTEIN PRECURSOR (SPBP) pir||D40840 
spermidine/putrescine-binding protein precursor [validated] - 
Escherichia coli gb|AAC37041.1| (M64519) transport protein 
[Escherichia coli] dbj|BAA35943.1| (D90747) 
Spermidine/putrescine transport protein D [Escherichia 
coli] gb|AAC74207.1| (AE000212) spermidine/putrescine 
periplasmic transport protein [Escherichia coli K12] 
Length = 348 


Identities = 97/249 (38%), Positives = 159/249 (62%), Gaps = 
3/249 (1%) pir||G70179 spermidine/putrescine ABC transporter 

permease protein (potC) homolog - Lyme disease 
spirochete gb)AAB91 527.1 1 (AE001165) spermidine/putrescint 
ABC transporter, permease protein (potC) [Borrelia 
burgdorferi] Length = 263 


Identities = 90/255 (35%), Positives = 153/255 (59%), Gaps = 
11/255 (4%) sp|P45170|POTB HAEIN 
SPERMIDINE/PUTRESCINE TRANSPORT SYSTEM 
PERMEASE PROTEIN POTB pir||A64118 spermidine/putrescir 
transport system permease potB - Haemophilus influenzc 
(strain Rd KW20) gb|AAC22990.1| (U32813) 
spermidine/putrescine ABC transporter, permease protein 
(potB) [Haemophilus influenzae Rd] Length = 286 


Identities = 165/345 (47%), Positives = 240/345 (68%), Gaps = 
1/345 (0%) pir||A70180 spermidine/putrescine ABC transporter 

ATP-binding protein (potA) homolog - Lyme disease 
spirochete gb|AAB91 525.1 1 (AE001165) spermidine/putrescin< 

ABC transporter, ATP-binding protein (potA) [Borrelia 
burgdorferi] Length = 347 
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Identities = 121/304 (39%), Positives = 176/304 (57%) 
dbj|BAB04287.1| (AP001509) nickel transport system (permease) 
[Bacillus halodurans] Length = 314 


Identities = 106/255 (41%), Positives = 164/255 (63%) 
dbj|BAB04288.1| (AP001509) nickel transport system (permease) 
[Bacillus halodurans] Length = 277 


Identities = 85/253 (33%), Positives = 154/253 (60%), Gaps = 

2/253 (0%) gb|AAF73561.1| (AE002315) peptide ABC 
transporter, ATP-binding protein [Chlamydia muridarum] 
Length = 281 

Identities = 81/199 (40%), Positives = 131/199 (65%), Gaps = 


transporter (ATP-binding protein) [Bacillus halodurans] 
Length = 244 

Identities = 143/238 (60%), Positives = 193/238 (81%) 
sp|031749|PYRH_BACSU URIDYLATE KINASE (UK) (URIDINE 
MONOPHOSPHATE KINASE) (UMP KINASE) pir||F69708 
uridylate kinase smbA - Bacillus subtilis emb|CAB13524.1| 
(Z991 1 2) uridylate kinase [Bacillus subtilis] Length = 240 


Identities = 112/185 (60%), Positives = 149/185 (80%) 
dbj|BAB06143.1| (AP001515) ribosome recycling factor [Bacillus 
halodurans] Length = 185 


Identities = 107/269 (39%), Positives = 155/269 (56%), Gaps = 
6/269 (2%) pir||E69840 hypothetical protein yitL - Bacillus subtilis 
emb|CAB12943.1| (Z99109) yitL [Bacillus subtilis] Length = 
298 


Identities = 102/175 (58%), Positives = 127/175 (72%), Gaps = 
2/175 (1%) dbj|BAB05167.1| (AP001512) peptide methionine 
sulfoxide reductase [Bacillus halodurans] Length = 
179 




s 


I ■ 


is fe 


£ 


? 




! 

! 


a 

I 
I 


Contig 138 (90969-91175 p) 
Contig134 (54614-55414 p) 


Contig134 (55401-56081 p) j 
Contig 134 (56202-56930 p) 


-a 

i 

! 


Contig134 (57621-58475 p) 


Contig 134 (58601-59122 p) 


I 


! 


i ! 


I ! 


S 


I 


! 


I 


I 
I 


i 1 
! I 


s 1 

I I 


i 
! 


SeqID 510 


SeqID 511 



WO 02/092818 



99 



PCT/IB02/03059 

















4/66 (36%), Positives = 42/66 (63%) pir||A69931 
rotein yozE - Bacillus subtilis emb|CAB13859.1| 
) yozE [Bacillus subtilis] Length = 74 


= 472/590 (80%), Positives = 535/590 (90%) 
370.1| (U09352) 67 kDa Myosin-crossreactive 
cal antigen [Streptococcus pyogenes] 
Length = 590 


1/305 (62%), Positives = 241/305 (78%), Gaps = 
D|P46343|PHOL_BACSU PHOH-LIKE PROTEIN 
Dsphate starvation-induced protein phoH - Bacillu 
BAA1 2477.1 1 (D84432) YqfE [Bacillus subtilis] 
476.1| (Z991 17) phosphate starvation-induced 
'in [Bacillus subtilis] Length = 319 


2/161 (26%), Positives = 72/161 (44%), Gaps = 
(11%) gb|AAC95491.1| (U73025) unknown 
occus aureus] gb|AAG42230.1|AF299292_4 
3FX [Staphylococcus intermedius] Length 
289 


6/589 (29%), Positives = 315/589 (52%), Gaps = 
) dbj|BAB06875.1| (AP001517) two-component 
le kinase involved in phosphate regulation 
cillus halodurans] Length = 589 


3/224 (43%), Positives = 138/224 (60%), Gaps = 
P45606|PHOB SHIDY PHOSPHATE REGULOr 
OPTIONAL REGULATORY PROTEIN PHOB 
oB protein - Shigella dysenteriae gb|AAA26535.' 

phosphate regulatory protein phoB [Shigella 

dysenteriae] Length = 229 


Identities = 2- 
hypothetical c 
(Z991V 


Identities 


gb|AAA51f 
streptococ 


Identities = 19 
1/305 (0%) s| 
pir||E69676 ph< 
subtilis dbj 
emb|CAB1^ 
prate 


Identities = A 
19/161 
[Staphyloc 
(AF299292) Ol 


Identities =17 
47/589 (7% 
sensor histidir 
[Be 


Identities = 9: 
2/224 (0%) sp! 

TRANSCF 
pir||A44753 ph 
(M31793) 
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Identities = 360/785 (45%), Positives = 496/785 (62%), Gaps = 
15/785 (1%) pir||S76896 hypothetical protein - Synechocystis sp. 
(strain PCC 6803) dbj|BAA18808.1| (D90917) hypothetical 
protein [Synechocystis sp.] Length = 821 


Identities = 211/363 (58%), Positives = 270/363 (74%), Gaps = 
9/363 (2%) sp|P39300|YJFR_ECOLI HYPOTHETICAL 40.1 KD 
PROTEIN IN AIDB-SGAT INTERGENIC REGION Length = 
354 


Identities = 136/511 (26%), Positives = 234/511 (45%), Gaps = 
29/511 (5%) dbj|BAB03939.1| (AP001507) unknown conserved 
protein [Bacillus halodurans] Length = 701 


Identities = 58/235 (24%), Positives = 104/235 (43%), Gaps = 
9/235 (3%) pir||C83362 hypothetical protein PA2260 [imported] - 

Pseudomonas aeruginosa (strain PA01 ) 
gb|AAG05648.1|AE004652_1 (AE004652) hypothetical protein 

[Pseudomonas aeruginosa] Length = 260 


Identities = 28/89 (31%), Positives = 44/89 (48%), Gaps = 3/89 
(3%) sp|P44991|LYXK_HAEIN PROBABLE L-XYLULOSE 

KINASE (L-XYLULOKINASE) pir||H64164 hypothetical protein 
H1 1027 - Haemophilus influenzae (strain Rd KW20) 

gb|AAC22687.1| (U32783) L-xylulose kinase (lyx) [Haemophilus 
influenzae Rd] Length = 485 


Identities = 126/393 (32%), Positives = 212/393 (53%), Gaps = 
16/393 (4%) sp|P37677lLYXK_ECOLI CRYPTIC L-XYLULOSE 
KINASE (L-XYLULOKINASE) pir||S47801 L-xylulokinase (EC 
2.7.1.53) - Escherichia coli gb|AAB18557.1| (U00039) No 

definition line found [Escherichia coli] gb|AAC76604.1| 
(AE000435) L-xylulose kinase, cryptic [Escherichia coli K12] 
Length = 498 
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Identities = 106/402 (26%), Positives = 196/402 (48%), Gaps = 
15/402 (3%) dbj|BAA75340.1| (AB011837) PTS system galactitol- 
specific enzyme IIC component [Bacillus halodurans] 
dbj|BAB03909.1| (AP001507) PTS system, galactitol-specific 
enzyme II, C component [Bacillus halodurans] 
Length = 419 


Identities = 123/326 (37%), Positives = 193/326 (58%), Gaps = 
8/326 (2%) pir||B75057 glycerate dehydrogenase PAB2374 - 
Pyrococcus abyssi (strain Orsay) emb|CAB50351.1| (AJ248287) 
GLYCERATE DEHYDROGENASE [Pyrococcus abyssi] 
Length = 335 




Identities = 101/275 (36%), Positives = 165/275 (59%), Gaps = 
22/275 (8%) gb|AAD50462.1|AF169967_5 (AF1 69967) BacA 
[Flavobacterium johnsoniae] Length = 265 


Identities = 168/248 (67%), Positives = 205/248 (81%), Gaps = 
9/248 (3%) dbj|BAA82113.1| (AB022909) negative regulator of 
genetic competence [Streptococcus mutans] Length 
= 240 


Identities = 103/460 (22%), Positives = 191/460 (41%), Gaps = 
72/460 (15%) pir||F69774 hypothetical protein ydcQ [imported] - 
Bacillus subtilis dbj|BAA19323.1| (AB001488) SIMILAR TO 
ORF21 OF ENTEROCOCCUS FAECALIS TRANSPOSON 
TN916. [Bacillus subtilis] emb|CAB12293.1| (Z99106) similar to 
transposon protein [Bacillus subtilis] Length = 480 


Identities = 267/382 (69%), Positives = 317/382 (82%) 
dbj|BAA82114.1| (AB022909) RgpG [Streptococcus mutans] 
Length = 388 
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Identities = 61/81 (75%), Positives = 71/81 (87%), Gaps = 1/81 
(1%) gb|AAF80389.1|AF160251_3 (AF1 60251) ribosomal protein 
L31 [Listeria innocua] Length = 81 


Identities = 257/429 (59%), Positives = 312/429 (71%), Gaps = 
7/429 (1%) pir||T46756 Zn-binding lipoprotein adcA [imported] - 
Streptococcus pneumoniae (fragment) emb|CAA96185.1| 
(Z71552) AdcA protein [Streptococcus pneumoniae] 
Length = 423 




Identities = 218/473 (46%), Positives = 310/473 (65%), Gaps = 
14/473 (2%) emb|CAA86210.1| (Z38063) dipeptidase 
[Lactobacillus helveticus] Length = 474 


Identities = 209/303 (68%), Positives = 260/303 (84%) 
emb|CAB96619.1| (AJ400630) hypothetical protein 

[Streptococcus pneumoniae bacteriophage MM1] 
emb|CAB96622.1| (AJ400631) hypothetical protein 
[Streptococcus pneumoniae] Length = 303 


Identities = 254/321 (79%), Positives = 286/321 (88%), Gaps = 
1/321 (0%) emb|CAB96620.1| (AJ400630) hypothetical protein 
[Streptococcus pneumoniae bacteriophage MM1] 
embiCAB96623.1| (AJ400631) hypothetical protein 
[Streptococcus pneumoniae] Length = 325 


Identities = 165/291 (56%), Positives = 208/291 (70%), Gaps = 
2/291 (0%) sp|O06973|YVCJ BACSU HYPOTHETICAL 33.9 KD 
PROTEIN IN CRH-TRXB INTERGENIC REGION pir||H70031 
conserved hypothetical protein yvcJ - Bacillus subtilis 
emb|CAB08057.1| (Z94043) hypothetical protein [Bacillus subtilis] 
emb|CAB1 5482.1 1 (Z99121) similar to hypothetical proteins 
[Bacillus subtilis] Length = 295 
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Identities = 53/112 (47%), Positives = 78/112 (69%), Gaps = 
1/112 (0%) gb|AAC23746.1| (AF052209) competence protein 
[Streptococcus pneumoniae] Length = 266 


Identities = 142/468 (30%), Positives = 220/468 (46%), Gaps = 
62/468 (13%) pir||F82995 giutamate-cysteine ligase PA5203 
[imported] - Pseudomonas aeruginosa (strain PA01) 
gb|AAG08588.1|AE004933_4 (AE004933) giutamate-cysteine 
ligase [Pseudomonas aeruginosa] Length = 527 


Identities = 107/223 (47%), Positives = 148/223 (65%), Gaps = 

7/223 (3%) pir||H81283 helix-turn-helix containing protein 
Cj1 387c [imported] - Campylobacter jejuni (strain NCTC 
11168) emb|CAB73814.1| (AL139078) helix-turn-helix containing 
protein [Campylobacter jejuni] Length = 218 




Identities = 225/341 (65%), Positives = 279/341 (80%) 
pir||A43577 regulatory protein pfoR - Clostridium perfringens 
Length = 343 


Identities = 320/427 (74%), Positives = 378/427 (87%) 
pir||A42280 adenylosuccinate synthase (EC 6.3.4.4) purA - 
Bacillus subtilis dbj|BAA05174.1| (D261 85) adenylosuccinate 

synthetase [Bacillus subtilis] emb|CAB16079.1| (Z99124) 
adenylosuccinate synthetase [Bacillus subtilis] Length = 
430 






Identities = 184/465 (39%), Positives = 279/465 (59%), Gaps = 
25/465 (5%) sp|P39301|SGAT_ECOLI PUTATIVE TRANSPORT 
PROTEIN SGAT pir||D65230 hypothetical 52.9 kD protein in aidB 
rpsF intergenic region - Escherichia coli (strain K-1 2) 
gb|AAC77150.1| (AE000491) orf, hypothetical protein 
[Escherichia coli K1 2] Length = 484 
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Identities = 110/230 (47%), Positives = 154/230 (66%), Gaps = 

3/230 (1%) ref|NP 012308.1 1 Yir042cp [Saccharomyces 
cerevisiae] sp|P40586|YIW2 YEAST HYPOTHETICAL 27.4 KD 
PROTEIN IN HYR1 3 REGION pir||S50347 hypothetical protein 
YIR042c - yeast (Saccharomyces cerevisiae) emb|CAA87001 .1| 
(Z46902) unknown [Saccharomyces cerevisiae] Length = 
236 


Identities = 118/139 (84%), Positives = 129/139 (91%) 
sp|P36254|RL11_STACA 50S RIBOSOMAL PROTEIN L11 
pir||S38871 ribosomal protein L11 - Staphylococcus carnosus 
emb|CAA53739.1| (X76134) L11 protein [Staphylococcus 
carnosus] Length = 140 


Identities = 118/405 (29%), Positives = 199/405 (49%), Gaps = 
9/405 (2%) pir||F70705 hypothetical protein Rv2333c - 
Mycobacterium tuberculosis (strain H37RV) 
emb|CAB02058.1 1 (Z79702) hypothetical protein Rv2333c 
[Mycobacterium tuberculosis] Length = 537 


Identities = 201/395 (50%), Positives = 274/395 (68%), Gaps = 
5/395 (1%) gb|AAF36227.1|AF168363_2 (AF168363) 
aminoacylase [Lactococcus lactis] Length = 398 


Identities = 72/259 (27%), Positives = 127/259 (48%), Gaps = 
7/259 (2%) ref|NP 043632.1 1 former trsE (rbcR homoiog) 
[Odontella sinensis] sp|P49518|YC30_ODOSI HYPOTHETICAL 
TRANSCRIPTIONAL REGULATOR YCF30 pir||S78291 probable 
transcription regulator ycf30 - Odontella sinensis 
chloroplast emb|CAA91664.1| (Z67753) former trsE (rbcR 
homoiog) [Odontella sinensis] Length = 309 
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Identities = 90/214 (42%), Positives = 131/214 (61%), Gaps = 
1/214 (0%) emblCAA05516.1| (AJ002527) OrfX [Clostridium 
beijerinckii] Length = 226 


Identities = 48/182 (26%), Positives = 91/182 (49%), Gaps = 
12/182 (6%) pir||B70391 transcription regulator TetR/AcrR family • 
Aquifex aeolicus gb|AAC07123.1| (AE000721) transcriptional 
regulator (TetR/AcrR family) [Aquifex aeolicus] 
Length = 179 


Identities = 414/805 (51%), Positives = 555/805 (68%), Gaps = 
14/805 (1%) sp|P75793|PFLF ECOLI PUTATIVE FORMATE 
ACETYLTRANSFERASE 3 (PYRUVATE FORMATE-LYASE 3) 
pirj|G64819 probable formate C-acetyltransferase (EC 2.3.1.54) - 
Escherichia coli gb|AAC73910.1| (AE0001 84) putative 

formate acetyltransferase [Escherichia coli K12] 
dbj|BAA35511.1] (D90720) Formate acetyltransferase 2 (EC 
2.3.1 .54) (pyruvate formate-lyase 2). [Escherichia coli] 
Length = 810 




Identities = 259/340 (76%), Positives = 294/340 (86%) 
gb|AAF34406.1|AF164204_1 (AF164204) branched-chain amino 

acid aminotransferase [Lactococcus lactis subsp. 
cremoris] gb|AAF64593.1|AF169649_1 (AF 169649) branched- 
chain aminotransferase llvE [Lactococcus lactis] 
Length = 340 


Identities = 640/821 (77%), Positives = 724/821 (87%), Gaps = 
5/821 (0%) gb|AAD34369.1|AF129764_3 (AF1 29764) ParC 
[Streptococcus mitis] Length = 823 


Identities = 574/649 (88%), Positives = 617/649 (94%), Gaps = 
2/649 (0%) emb|CAA91550.2| (Z67739) DNA topoisomerase IV 
[Streptococcus pneumoniae] Length = 647 
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Identities = 134/213 (62%), Positives = 169/213 (78%) 
sp|Q54916|YPAE STRPN HYPOTHETICAL 23.0 KD PROTEIN 
IN PARE 5 REGION (ORF2) emb|CAA91549.1| (Z67739) 
unidentified [Streptococcus pneumoniae! Length = 213 


Identities = 217/217 (100%), Positives = 217/217 (100%) 
sp|Q9XDS8|UNG_STRAG URACIL-DNA GLYCOSYLASE (UDG) 
dbj|BAA82292.1 1 (AB028896) Uracil DNA giycosylase 
[Streptococcus agalactiae] Length = 217 


Identities = 161/161 (100%), Positives = 161/161 (100%) 
dbj|BAA82291.1| (AB028896) ORF1 [Streptococcus agalactiae] 
Length = 161 


Identities = 413/413 (100%), Positives = 413/413 (100%) 
dbj|BAA82290.1| (AB028896) NeuA [Streptococcus agalactiae] 
Length = 413 


Identities = 64/187 (34%), Positives = 112/187 (59%), Gaps = 
1/187 (0%) pir||T36287 probable integral membrane protein - 
Streptomyces coelicolor emb|CAB42664.1| (AL049819) putative 
integral membrane protein [Streptomyces coelicolor A3(2)] 
Length = 266 


Identities = 209/209 (100%), Positives = 209/209 (100%) 
dbj|BAA82289.1| (AB028896) NeuD [Streptococcus agalactiae] 
Length = 209 


Identities = 384/384 (100%), Positives = 384/384 (100%) 
dbj|BAA82288.1| (AB028896) NeuC [Streptococcus agalactiae] 
Length = 384 


Identities = 341/341 (100%), Positives = 341/341 (100%) 
dbj|BAA33753.1| (AB017355) neuB [Streptococcus agalactiae] 
dbj|BAA82287.1| (AB028896) NeuB [Streptococcus agalactiae] 
Length = 341 


r- 
CD 




CD 
OJ 


8 


o 

CO 


CO 
OJ 


c§ 


r~ 
o> 


Contig135 (16949-17587 m) 


Contig135 (16230-16883 p) 


Contig135 (15646-16131 p) 


Contigl 35 (14291-15532 p) 


Contigl 38 (80519-81616 p) 


Contig135 (13651-14280 p) 


Contigl 35 (12500-13654 p) 


Contig135 (11398-12423 p) 


SA-1 525.1 


SA-1 526.1 






SA-1 527.1 


SA-1 528.1 


SA-1 53.1 


SA-1 530.1 


SA-1 531.1 


SA-1 532.1 


i 

SeqID 638 I 


SeqID 639 j 






SeqID 640 


s 

9 

cr 
CD 
CO 


SeqID 642 


SeqID 643 


SeqID 644 


SeqID 645 



WO 02/092818 



117 



PCT/IB02/03059 



Identities = 466/466 (100%), Positives = 466/466 (100%) 
pir||T44650 capsular polysaccharide repeat unit transporter cpsM 
[imported]- Streptococcus agalactiae dbj|BAA33752.1| 
(AB017355) capsular polysaccharide [Streptococcus agalactiae] 
dbj|BAA82286.1| (AB028896) CpslaL [Streptococcus agalactiae] 
gb|AAD53073.1|AF163833_13 (AF163833) CpsM [Streptococcus 
agalactiae] Length = 466 


Identities = 87/228 (38%), Positives = 150/228 (65%), Gaps = 
1/228 (0%) sp|P54591|YHCG_BACSU HYPOTHETICAL ABC 
TRANSPORTER ATP-BINDING PROTEIN 1 IN GLPD-CSPB 
INTERGENIC REGION pir||C69822 glycine betaine/L-proline 
transport homolog yhcG - Bacillus subtiiis 
emb|CAA65690.1| (X96983) hypothetical protein [Bacillus subtiiis] 
emblCABI 2735.1 1 (Z99108) similar to glycine betaine/L-proline 
transport [Bacillus subtiiis] Length = 232 


Identities = 49/208 (23%), Positives = 102/208 (48%), Gaps = 
20/208 (9%) gb|AAA29909.1| (M74170) ORF 3 [Schistosoma 
mansoni] Length = 393 


Identities = 43/174 (24%), Positives = 84/174 (47%), Gaps = 
9/174 (5%) pir||F64934 hypothetical protein b1750 - Escherichia 
coli (strain K-12) gb|AAC74820.1| (AE000270) orf, hypothetical 
j protein [Escherichia coli K12] Length = 252 


Identities = 63/135 (46%), Positives = 83/135 (60%), Gaps = 
6/135 (4%) sp|P26840|MATA BACSH PROBABLE MACROLIDE 
ACETYLTRANSFERASE Length = 180 




Identities = 37/92 (40%), Positives = 52/92 (56%), Gaps = 10/92 
(10%) emb|CAA59764.1| (X85757) unknown [Saccharomyces 
cerevisiae] Length = 133 
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Identities = 30/96 (31%), Positives = 46/96 (47%), Gaps = 9/96 

(9%) gb|AAD33086.1|AF071083_1 (AF071083) fibronectin- 
binding protein I [Streptococcus pyogenes] Length = 1 161 




Identities = 23/67 (34%), Positives = 37/67 (54%), Gaps = 2/67 

(2%) gb|AAB00100.1| (L36660) unknown [Streptococcus 
pneumoniae] emb|CAA84075.1| (Z34303) hypothetical protein 
[Streptococcus pneumoniae] Length = 194 


Identities = 45/205 (21 %), Positives = 93/205 (44%), Gaps = 
10/205 (4%) dbj|BAB04126.1| (AP001508) unknown conserved 
protein in others [Bacillus halodurans] Length = 228 




Identities = 72/279 (25%), Positives = 125/279 (43%), Gaps = 
25/279 (8%) dbj|BAA24012.1| (AB009635) Fmt [Staphylococcus 
aureus] Length = 397 


Identities = 141/331 (42%), Positives = 201/331 (60%), Gaps = 
34/331 (10%) pir||G75548 ABC transporter, ATP-binding protein - 

Deinococcus radiodurans (strain R1) 
gb|AAF09790.1|AE001882_8 (AE001882) ABC transporter, ATP- 
binding protein [Deinococcus radiodurans] Length = 
354 


Identities = 60/271 (22%), Positives = 1 18/271 (43%), Gaps ■ 
13/271 (4%) emb|CAB88837.1| (AL353832) putative integral 
membrane protein. [Streptomyces coelicolor A3(2)] 
Length = 268 
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Identities = 68/264 (25%), Positives = 123/264 (45%), Gaps = 
10/264 (3%) emb|CAB88836.1| (AL353832) putative integral 
membrane transport protein. [Streptomyces coelicolor 
A3(2)] Length = 295 


Identities = 25/84 (29%), Positives = 45/84 (52%), Gaps = 6/84 
(7%) gb|AAD31042.1|AF144646_1 (AF144646) heat shock 
protein 70 [Crassostrea gigas] Length = 659 


Identities = 175/280 (62%), Positives = 218/280 (77%), Gaps = 
9/280 (3%) sp|O07874|RNH3_STRPN RIBONUCLEASE Hill 
(RNASE Hill) gb|AAC45437.1| (U93576) ribonuclease HII 
[Streptococcus pneumoniae] Length = 290 


Identities = 67/133 (50%), Positives = 86/133 (64%), Gaps = 
16/133 (12%) dbj|BAB04125.1| (AP001508) unknown conserved 
protein in others [Bacillus halodurans] Length = 174 


Identities = 120/203 (59%), Positives = 145/203 (71%), Gaps = 

9/203 (4%) sp|O07344|LEP_STRPN SIGNAL PEPTIDASE I 
(SPASE I) (LEADER PEPTIDASE I) gb|AAB69116.1| (U90721) 
signal peptidase I [Streptococcus pneumoniae] Length = 
204 


Identities = 454/835 (54%), Positives = 600/835 (71%), Gaps = 
37/835 (4%) gb|AAK05838.1|AE006404_5 (AE006404) 
exodeoxyribonuclease V alpha chain (EC 3.1.11.5) 
[Lactococcus lactis subsp. lactis] Length = 834 

i 


Identities = 47/173 (27%), Positives = 76/173 (43%), Gaps = 
17/173 (9%) emb|CAA72923.1| (Y12234) hypothetical protein 
[Enterococcus faecalis] Length = 1 69 
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Identities = 58/144 (40%), Positives = 92/144 (63%) 
gb|AAK05931.1|AE006413_7 (AE006413) conserved hypothetical 
protein [Lactococcus lactis subsp. lactis] Length = 
145 


Identities = 106/401 (26%), Positives = 199/401 (49%), Gaps = 
21/401 (5%) pir||B70065 antibiotic resistance protein homolog 
ywoG - Bacillus subtiiis emb|CAB05383.1| (Z82987) unknown 
similar to quinolon resistance protein NorA [Bacillus 
subtiiis] emb|CAB1 5662.1 1 (Z99122) similar to antibiotic 
resistance protein [Bacillus subtiiis] Length = 396 


Identities = 280/458 (61%), Positives = 363/458 (79%), Gaps = 
3/458 (0%) gb|AAD47594.1|AF140784_3 (AF140784) Vexp3 
[Streptococcus pneumoniae] Length = 459 


Identities = 142/207 (68%), Positives = 169/207 (81%) 
gb|AAD47593.1|AF140784_2 (AF140784) Vexp2 [Streptococcus 
pneumoniae] Length = 215 


Identities = 165/425 (38%), Positives = 271/425 (62%), Gaps = 
4/425 (0%) gb|AAD47592.1|AF140784_1 (AF140784) Vexpl 
[Streptococcus pneumoniae] Length = 425 


Identities = 44/150 (29%), Positives = 80/150 (53%), Gaps = 
14/150 (9%) sp|P16396|SUBE BACSU MINOR 
EXTRACELLULAR PROTEASE EPR PRECURSOR 
pir||SUBSMP serine proteinase (EC 3.4.21 .-) epr precursor - 
Bacillus subtiiis emb|CAA37392.1| (X53307) prepropeptide (AA - 
27 to 618) [Bacillus subtiiis] gb|AAA22423.1( (M22407) 

extracellular protease precursor [Bacillus subtiiis] 
emb|CAA51571.1| (X73124) ipa-15repr [Bacillus subtiiis] 
emb|CAB1 5866.1 1 (Z99123) extracellular serine protease 
j [Bacillus subtiiis] Length = 645 
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Identities = 110/115 (95%), Positives =112/115 (96%) 
sp|O34031|RL19_STRTR 50S RIBOSOMAL PROTEIN L19 
gb|AAC01534.1| (U88973) ribosomal protein L19 [Streptococcus 
thermophilus] Length = 115 


Identities = 131/393 (33%), Positives = 206/393 (52%), Gaps = 
20/393 (5%) pir||T44296 hypothetical protein [imported] - Bacillus 
halodurans dbj|BAA75315.1| (AB011836) similar to Bordetella 
parapertussis transposase for insertion sequence 
element(27 -identity) [Bacillus halodurans] 
dbj|BAB04382.1| (AP001509) unknown conserved protein in 
others [Bacillus halodurans] Length = 424 


Identities = 24/89 (26%), Positives = 50/89 (55%), Gaps = 2/89 
(2%) pir||G71950 hypothetical protein jhp0276 - Helicobacter 
pylori (strain J99) gb|AAD05867.1| (AE001465) putative 
[Helicobacter pylori J99] Length = 100 


Identities = 35/103 (33%), Positives = 46/103 (43%), Gaps = 
14/103 (13%) gb|AAC02237.1| (U72957) merozoite surface 
protein 2 [Plasmodium falciparum] Length = 176 


Identities = 236/387 (60%), Positives = 281/387 (71%), Gaps = 
10/387 (2%) gb|AAK05433.1lAE006366_2 (AE006366) N- 
acetylglucosamine-6-phosphate deacetylase (EC 3.5.1 .25) 
[Lactococcus lactis subsp. lactis] Length = 382 


Identities = 63/146 (43%), Positives = 87/146 (59%), Gaps = 
1/146 (0%) sp|034589|FLAW_BACSU PROBABLE 
FLAVODOXIN 2 pir||E69866 flavodoxin homolog ykuP[similarity] 
Bacillus subtilis emb|CAA10879.1| (AJ222587) YkuP protein 
[Bacillus subtilis] emb|CAB13290.1| (Z99111) similar to sulfite 
reductase [Bacillus subtilis] Length = 178 
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Identities = 301/610 (49%), Positives = 437/610 (71%), Gaps = 
9/610 (1%) dbj|BAB05348.1| (AP001512) unknown conserved 
protein [Bacillus halodurans] Length = 618 


Identities = 397/751 (52%), Positives = 519/751 (68%), Gaps = 
14/751 (1%) dbj|BAB04157.1i (AP001508) homosystein methyl 
transferase [Bacillus halodurans] Length = 756 




Identities = 86/225 (38%), Positives = 142/225 (62%), Gaps = 
1/225 (0%) gb|AAK05711.1|AE006391_10 (AE006391) amino 
acid permease [Lactococcus lactis subsp. lactis] Length = 
235 








Identities = 544/880 (61%), Positives = 676/880 (76%), Gaps = 
11/880 (1%) pir||SYBSVS valine-tRNA ligase (EC 6.1.1.9) - 
Bacillus stearothermophilus Length = 880 


Identities = 228/526 (43%), Positives = 331/526 (62%), Gaps = 

2/526 (0%) emb|CAB69752.1| (AL137187) putative ABC 
transporter [Streptomyces coelicolor A3(2)] Length = 642 


Identities = 57/231 (24%), Positives = 109/231 (46%), Gaps = 
10/231 (4%) pir||T35598 hypothetical protein SC6G9.01c - 

Streptomyces coelicolor (fragment) emb|CAB45592.1| 
(AL079356) hypothetical protein [Streptomyces coelicolor] 
Length = 409 


Identities = 100/306 (32%), Positives = 152/306 (48%), Gaps = 
3/306 (0%) pir||T50594 probable oxidoreductase [imported] - 
Streptomyces coelicolor emb|CAB61731.1| (AL1 33220) putative 
oxidoreductase. [Streptomyces coelicolor A3(2)] Length = 
351 
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Identities = 70/284 (24%), Positives = 135/284 (46%), Gaps = 
8/284 (2%) ref|NP_053049.1| hypothetical protein [Plasmid 
pNZ4000] gb|AAD40365.1| (AF036485) hypothetical protein 
[Plasmid pNZ4000] Length = 302 


Identities = 38/107 (35%), Positives = 59/107 (54%), Gaps = 
6/107 (5%) sp|P37507|YYAQ BACSU HYPOTHETICAL 13.9 KD 
PROTEIN IN COTF-TETB INTERGENIC REGION pir||S66000 

yyaQ protein - Bacillus subtilis dbj|BAA05206.1| (D26185) 
unknown [Bacillus subtilis] emb|CAB16112.1| (Z99124) yyaQ 
[Bacillus subtilis] Length = 118 


Identities = 234/384 (60%), Positives = 300/384 (77%), Gaps = 

2/384 (0%) sp|P42602|YGJU_ECOLI HYPOTHETICAL 
SYMPORTER YGJU pir||F65097 hypothetical 43.5 kD protein in 
ebgC-exuT intergenic region - Escherichia coli (strain K- 
12) gb|AAA57891.1| (U18997) ORF_o414; Geneplot suggests 
frameshift near start but none found [Escherichia coli] 
gb|AAC76124.1| (AE000391) putative transport protein 
[Escherichia coli K1 2] Length = 414 


Identities = 109/182 (59%), Positives = 141/182 (76%) 
emb|CAB59830.1| (AJ012388) hypothetical protein [Lactococcus 
lactis] Length = 182 


Identities = 67/182 (36%), Positives = 111/182 (60%), Gaps = 
4/182 (2%) dbj|BAB05604.1| (AP001513) unknown conserved 
protein [Bacillus halodurans] Length = 251 


Identities = 150/481 (31%), Positives = 247/481 (51%), Gaps = 
15/481 (3%) pir||H69858 cation ABC transporter (ATP-binding 
protein) homolog ykoD - Bacillus subtilis 
emb|CAA05601.1| (AJ002571) YkoD [Bacillus subtilis] 
emb|CAB13179.1| (Z991 10) similar to cation ABC transporter 
(ATP-binding protein) [Bacillus subtilis] Length = 490 
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Identities = 70/284 (24%), Positives = 135/284 (46%), Gaps = 
8/284 (2%) ref|NP_053049.1| hypothetical protein [Plasmid 
pNZ4000] gb|AAD40365.1| (AF036485) hypothetical protein 
[Plasmid pNZ4000] Length = 302 


Identities = 38/107 (35%), Positives = 59/107 (54%), Gaps = 
6/107 (5%) sp|P37507|YYAQ BACSU HYPOTHETICAL 13.9 KD 
PROTEIN IN COTF-TETB INTERGENIC REGION pir||S66000 

yyaQ protein - Bacillus subtilis dbj|BAA05206.1| (D26185) 
unknown [Bacillus subtilis] emb|CAB16112.1| (Z99124) yyaQ 
[Bacillus subtilis] Length = 118 


Identities = 234/384 (60%), Positives = 300/384 (77%), Gaps = 

2/384 (0%) sp|P42602|YGJU_ECOLI HYPOTHETICAL 
SYMPORTER YGJU pir||F65097 hypothetical 43.5 kD protein in 
ebgC-exuT intergenic region - Escherichia coli (strain K- 
12) gb|AAA57891.1| (U18997) ORF_o414; Geneplot suggests 
frameshift near start but none found [Escherichia coli] 
gb|AAC76124.1| (AE000391) putative transport protein 
[Escherichia coli K1 2] Length = 414 


Identities = 109/182 (59%), Positives = 141/182 (76%) 
emb|CAB59830.1| (AJ012388) hypothetical protein [Lactococcus 
lactis] Length = 182 


Identities = 67/182 (36%), Positives = 11 1/182 (60%), Gaps = 
4/182 (2%) dbj|BAB05604.1| (AP001513) unknown conserved 
protein [Bacillus halodurans] Length = 251 


Identities = 150/481 (31%), Positives = 247/481 (51%), Gaps = 
15/481 (3%) pir||H69858 cation ABC transporter (ATP-binding 
protein) homolog ykoD - Bacillus subtilis 
emb|CAA05601.1| (AJ002571) YkoD [Bacillus subtilis] 
emb|CAB13179.1| (Z99110) similar to cation ABC transporter 
(ATP-binding protein) [Bacillus subtilis] Length = 490 
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Identities = 193/229 (84%), Positives = 211/229 (91%), Gaps = 
1/229 (0%) gb|AAC64935.1| (AF082668) CsrR [Streptococcus 
pyogenes] Length = 228 


Identities = 248/501 (49%), Positives = 364/501 (72%), Gaps = 
4/501 (0%) gb|AAC64936.1| (AF082668) CsrS [Streptococcus 
pyogenes] Length = 500 


Identities = 84/226 (37%), Positives = 138/226 (60%), Gaps = 

9/226 (3%) dbj|BAB04091.1| (AP001508) two-component 
response regulator [Bacillus halodurans] Length = 222 


Identities = 49/136 (36%), Positives = 69/136 (50%), Gaps = 
8/136 (5%) pir||G75571 MutT/nudix family protein - Deinococcus 

radiodurans (strain R1) gb|AAF09597.1|AE001864_3 
(AE001864) MutT/nudix family protein [Deinococcus radiodurans] 
Length = 350 


Identities = 70/254 (27%), Positives = 127/254 (49%), Gaps = 
2/254 (0%) pir||G83412 hypothetical protein PA1860 [imported] - 

Pseudomonas aeruginosa (strain PA01) 
gb|AAG05249.1|AE004612_3 (AE004612) hypothetical protein 
[Pseudomonas aeruginosa] Length = 275 


Identities = 140/164 (85%), Positives = 157/164 (95%) 
gb|AAC38046.1| (AF000954) No definition line found 
[Streptococcus mutans] Length = 164 


Identities = 109/133 (81%), Positives = 122/133 (90%), Gaps = 
2/133 (1%) pir||A36933 diacylglycerol kinase homolog - 
Streptococcus mutans Length = 137 


Identities = 273/299 (91%), Positives = 290/299 (96%) 
gb|AAD41632.1|AF072811_1 (AF072811) GTPase Era 
[Streptococcus pneumoniae] Length = 299 
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Identities = 71/223 (31%), Positives = 139/223 (61%), Gaps = 

7/223 (3%) dbj|BAB06470.1| (AP001516) two-component 
response regulator [Bacillus halodurans] Length = 230 


Identities = 132/461 (28%), Positives = 245/461 (52%), Gaps = 
7/461 (1%) pir||A70009 two-component sensor histidine kinase 
homolog yufL - Bacillus subtilis emb|CAB07946.1| 
(Z93937) unknown [Bacillus subtilis] emb|CAB15141.1| (Z99120) 
similar to two-component sensor histidine kinase [YufM] 
[Bacillus subtilis] Length = 533 


Identities = 329/428 (76%), Positives = 375/428 (86%) 
gb|AAB1 8291.1 1 (U35658) L-malate permease [Streptococcus 
bovis] Length = 441 


Identities = 36/70 (51%), Positives = 44/70 (62%) pir||B72732 
hypothetical protein APE0395 - Aeropyrum pernix (strain K1) 
dbj|BAA79350.1| (AP000059) 127aa long hypothetical protein 
[Aeropyrum pernix] Length = 127 


Identities = 285/386 (73%), Positives = 332/386 (85%), Gaps = 
1/386 (0%) gb|AAB07709.1| (U35659) malic enzyme 
[Streptococcus bovis] Length = 389 


Identities = 220/312 (70%), Positives = 264/312 (84%) 
gb|AAG02456.1|AF290099_2 (AF290099) mevalonate 
diphosphate decarboxylase [Streptococcus pneumoniae] 
Length = 317 


Identities = 74/146 (50%), Positives = 103/146 (69%), Gaps = 

3/146 (2%) gb|AAK04739.1|AE006297_2 (AE006297) 
transctiptional regulator CtsR [Lactococcus lactis subsp. 
lactis] Length = 151 


Identities = 404/831 (48%), Positives = 567/831 (67%), Gaps = 
52/831 (6%) gb|AAK04740.1|AE006297_3 (AE006297) ATP- 
dependent protease ATP-binding subunit [Lactococcus 
lactis subsp. lactis] Length = 816 
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Identities = 53/156 (33%), Positives = 84/156 (52%) 
gb|AAF15587.1|AF187951_1 (AF187951) promotes resistance to 
glutamine synthetase inhibitors [Activation-tagging vector 
PSKI015] Length = 183 


Identities = 179/213 (84%), Positives = 197/213 (92%) 
gb|AAC97156.1| (U49397) unknown [Streptococcus pyogenes] 
Length = 21 3 


Identities = 282/325 (86%), Positives = 306/325 (93%) 
gb|AAC97155.1| (U49397) unknown [Streptococcus pyogenes] 
Length = 325 


Identities = 224/271 (82%), Positives = 247/271 (90%) 
sp|Q9ZB45|HSLO_STRPY 33 KDA CHAPERONIN (HEAT 
SHOCK PROTEIN 33 HOMOLOG) (HSP33) gb|AAC97154.1| 
(U49397) unknown [Streptococcus pyogenes] Length = 
277 


Identities = 64/350 (18%), Positives = 146/350 (41%), Gaps = 
7/350 (2%) gb|AAB93480.1| (AF019377) tellurite resistance 
protein [Rhodobacter sphaeroides] Length = 396 


Identities = 56/238 (23%), Positives = 105/238 (43%), Gaps = 
25/238 (10%) emb|CAB39037.2| (AL034559) hypothetical protein, 
PFC0960C [Plasmodium falciparum] Length = 1 946 


Identities = 170/330 (51%), Positives = 233/330 (70%), Gaps = 
1/330 (0%) gb|AAG02457.1|AF290099_3 (AF290099) 
phosphomevalonate kinase [Streptococcus pneumoniae] 
Length = 336 


Identities = 35/76 (46%), Positives = 49/76 (64%) 
gb|AAK03132.1| (AE006146) unknown [Pasteureiia multocida] 
Length = 757 


Identities = 143/211 (67%), Positives = 170/211 (79%), Gaps = 
3/211 (1%) gb|AAD00288.1| (U78607) putative secreted protein 
[Streptococcus mutans] Length = 211 


Identities = 209/312 (66%), Positives = 266/312 (84%), Gaps = 
3/312 (0%) gb|AAA62181.1| (M92842) prs [Listeria 
monocytogenes] Length = 318 
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Identities = 54/136 (39%), Positives = 77/136 (55%), Gaps = 
19/136 (13%) pir||JQ0138 hypothetical 18.2K protein - 
Pseudomonas aeruginosa Length = 202 


Identities = 96/302 (31%), Positives = 143/302 (46%), Gaps = 
37/302 (12%) gb|AAB71985.1| (U73163) M-like protein 
[Streptococcus equi] Length = 374 

Identities = 147/473 (31%), Positives = 256/473 (54%), Gaps = 
34/473 (7%) pir||D69159 methyl coenzyme M reductase system, 
component A2 homolog - Methanobacterium 


(AE000829) methyl coenzyme M reductase system, component 
A2 homolog [Methanothermobacter thermautotrophicus] 
Length = 480 

Identities = 49/192 (25%), Positives = 89/192 (45%), Gaps = 
6/192 (3%) pir||C69159 conserved hypothetical protein MTH453 - 
Methanobacterium thermoautotrophicum (strain Delta H) 
gb|AAB84959.1| (AE000829) conserved protein 


Identities = 86/291 (29%), Positives = 151/291 (51%), Gaps = 
28/291 (9%) dbj|BAB1 0885.1 1 (AB010693) 
gene_id:K21C13.21~pir|lT04769~strong similarity to 
unknown protein [Arabidopsis thaliana] Length = 325 


Identities = 38/153 (24%), Positives = 68/153 (43%), Gaps = 
1/153 (0%) emb|CAC1 7502.1 1 (AL450432) conserved 
hypothetical protein [Streptomyces coelicolor] Length = 677 
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Identities = 204/383 (53%), Positives = 276/383 (71%), Gaps = 
3/383 (0%) sp|P50840|YPSC BACSU HYPOTHETICAL 43.5 KD 

PROTEIN IN COTD-KDUD INTERGENIC REGION 
PRECURSOR pir||F69941 conserved hypothetical protein ypsC - 
Bacillus subtilis gb|AAB38473.1| (L47838) putative [Bacillus 
subtilis] emb|CAB14134.1| (Z99115) similar to hypothetical 
proteins [Bacillus subtilis] Length = 385 


Identities = 83/166 (50%), Positives = 121/166 (72%), Gaps = 
1/166 (0%) gb|AAC33872.1| (AF055727) dihydrofolate reductase 
[Streptococcus pneumoniae] Length = 168 


Identities = 46/102 (45%), Positives = 69/102 (67%), Gaps = 
14/102 (13%) sp|P50839|YPSB BACSU HYPOTHETICAL 11.6 
KD PROTEIN IN COTD-KDUD INTERGENIC REGION 
pir||E69941 hypothetical protein ypsB - Bacillus subtilis 
gb|AAB38472.1| (L47838) putative [Bacillus subtilis] 
emb|CAB14135.1| (Z99115) ypsB [Bacillus subtilis] Length 
= 98 


Identities = 131/350 (37%), Positives = 200/350 (56%), Gaps = 
14/350 (4%) sp|P42977|PAPS_BACSU POLY(A) POLYMERASE 
(PAP) pir||B69672 poly(A) polymerase papS - Bacillus subtilis 
gb|AAB38446.1| (L47709) poly(A) polymerase [Bacillus subtilis] 
emb|CAB14161.1| (Z99115) poly(A) polymerase [Bacillus subtilis] 
Length = 397 


Identities = 269/625 (43%), Positives = 397/625 (63%), Gaps = 
1 1/625 (1%) pir||A69814 ABC transporter (ATP-binding protein) 

homolog yfmR - Bacillus subtilis dbj|BAA20107.1| 
(D86418) YfmR [Bacillus subtilis] emb|CAB12556.1| (Z99107) 

similar to ABC transporter (ATP-binding protein) [Bacillus 
subtilis] emb|CAB12566.1| (Z99108) similar to ABC transporter 
(ATP-binding protein) [Bacillus subtilis] Length = 629 
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>sitives = 92/161 (56%), Gaps = 
ECOLI HYPOTHETICAL 18.6 KDA 
RGENIC REGION Length = 
167 


jsitives = 342/565 (60%), Gaps = 
1.1| (AL137187) putative ABC 
licolor A3(2)] Length = 577 


jsitives = 391/61 1 (63%), Gaps = 
2.1|(AL137187) putative ABC 
licolor A3(2)] Length = 642 


sitives = 118/167 (69%), Gaps = 
thetical protein (gtfD 3 region) - 
ns Length = 169 


jsitives = 329/500 (65%), Gaps = 
MALQ_STRPN 4-ALPHA- 
?ASE (AMYLOMALTASE) 

ENZYME) (D-ENZYME) 
amylomaltase [Streptococcus 
Length = 505 


jsitives = 452/776 (57%), Gaps = 
3 HSG_BACSU GLYCOGEN 
528 glycogen phosphorylase (EC 
S40052 glycogen phosphorylase 
btilis emb|CAA81044.1|(Z25795) 
acillus subtilis] gb|AAC00218.1| 
sphorylase [Bacillus subtilis] 
lycogen phosphorylase [Bacillus 
Length = 798 


Identities = 56/161 (34%), Pc 
8/161 (4%) sp|P39337|YJGM E 
PROTEIN IN ARGI-VALS INTE 


Identities = 227/565 (40%), Pc 
1/565 (0%) emb|CAB6975 
transporter [Streptomyces coe 


Identities = 270/611 (44%), Pc 
31/611 (5%) emb|CAB697J 
transporter [Streptomyces coe 


Identities = 78/167 (46%), Po 
1/167 (0%) pir||A33141 hypo 
Streptococcus muts 


Identities = 250/500 (50%), Pc 
4/500 (0%) sp|P29851| 
GLUCANOTRANSFEF 
(DISPROPORTIONATING 
gb|AAA26923.1|(J01796) 
pneumoniae] 


Identities = 297/776 (38%), Pc 
41/776 (5%) sp|P39123|F 
PHOSPHORYLASE pir||S36( 
2.4. 1.1)- Bacillus subtilis pir|| 
(EC 2.4.1.1) glgP- Bacillus sui 
Glycogen Phosphorylase [B; 

(AF008220) glycogen phc 
emb|CAB1 5072.1 1 (Z99119) c 
subtilis] 
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Identities = 178/715 (24%), Positives = 273/715 (37%), Gaps = 
1 17/715 (16%) pir||G41662 130K surface exclusion protein SedO 
precursor - Enterococcus faecalis plasmid pCF10 
gb|AAA65847.1| (M64978) surface exclusion protein [Plasmid 
pCF10] Length = 891 


Identities = 28/76 (36%), Positives = 55/76 (71%), Gaps = 4/76 
(5%) pir||E83139 exodeoxyribonuclease VII small subunit PA4042 

[imported] - Pseudomonas aeruginosa (strain PA01 ) 
gb|AAG07429.1|AE004821_2 (AE004821) exodeoxyribonuclease 
VII small subunit [Pseudomonas aeruginosa] Length 
= 80 


Identities = 194/446 (43%), Positives = 284/446 (63%), Gaps = 
10/446 (2%) sp|P54521|EX7L_BACSU PUTATIVE 
EXODEOXYRIBONUCLEASE LARGE SUBUNIT 
(EXONUCLEASE VII LARGE SUBUNIT) pir||G69960 
exodeoxyribonuclease VII (large subunit) homolog yqiB - Bacillus 

subtilis dbj|BAA1 2573.1 1 (D84432) YqiB [Bacillus subtilis] 
emb|CAB14361.1| (Z99116) similar to exodeoxyribonuclease VII 
(large subunit) [Bacillus subtilis] Length = 448 


Identities = 149/277 (53%), Positives = 191/277 (68%) 
sp|P96051|YFOL STRTR HYPOTHETICAL 29.9 KD PROTEIN 

IN FOLD-PBP2B INTERGENIC REGION (ORF1 091 ) 
gb|AAC44613.1| (U58210) orf1091 [Streptococcus thermophilus] 
Length = 278 


Identities = 209/282 (74%), Positives = 248/282 (87%) 
sp|P96050|FOLD_STRTR FOLD BIFUNCTIONAL PROTEIN 

[INCLUDES: METHYLENETETRAHYDROFOLATE 
DEHYDROGENASE ; METHENYLTETRAHYDROFOLATE 
CYCLOHYDROLASE ] gblAAC44612.1| (U58210) 
tetrahydrofolate dehydrogenase/cyclohydrolase 
[Streptococcus thermophilus] Length = 284 
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Identities = 238/548 (43%), Positives = 343/548 (62%), Gaps = 

14/548 (2%) dbj|BAB04825.1| (AP001510) 
phosphomannomutase [Bacillus halodurans] Length = 578 


Identities = 153/239 (64%), Positives = 193/239 (80%) 
ref|NP_069514.1 1 glutamine ABC transporter, ATP-binding 
protein (glnQ) [Archaeoglobus fulgidus] pir||H69334 
glutamine transport protein glnQ - Archaeoglobus fulgidus 
gb|AAB90561.1| (AE001058) glutamine ABC transporter, ATP- 
binding protein (glnQ) [Archaeoglobus fulgidus] 
Length = 242 


Identities = 92/209 (44%), Positives = 129/209 (61%), Gaps = 
10/209 (4%) ref|NP_069070.1 1 glutamine ABC transporter, 
permease protein (glnP) [Archaeoglobus fulgidus] 
pir||H69278 glutamine ABC transporter, permease protein (glnP) 

homolog- Archaeoglobus fulgidus gb|AAB91000.1| 
(AE001090) glutamine ABC transporter, permease protein (glnP) 
[Archaeoglobus fulgidus] Length = 224 


Identities = 150/231 (64%), Positives = 178/231 (76%), Gaps = 

1/231 (0%) sp|Q9ZHA7|DCOP STRPN OROTIDINE 5 - 
PHOSPHATE DECARBOXYLASE (OMP DECARBOXYLASE) 
(OMPDCASE) gb|AAC95452.1| (AF068902) orotidine-5 - 
decarboxylase PyrF [Streptococcus pneumoniae] 
Length = 233 


Identities = 306/395 (77%), Positives = 357/395 (89%), Gaps = 
1/395 (0%) gb|AAF63738.1|AF236863_2 (AF236863) protease 
CIpX [Lactococcus lactis] Length = 41 1 


Identities = 152/208 (73%), Positives = 180/208 (86%) 
gb|AAC95453.1| (AF068902) orotate phosphoribosyltransferase 
PyrE [Streptococcus pneumoniae] Length = 210 
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Identities = 176/422 (41%), Positives = 255/422 (59%), Gaps = 
8/422 (1%) sp|O66990|PYRC_AQUAE DIHYDROOROTASE 

(DHOASE) pir||C70370 dihydroorotase - Aquifex aeolicus 
gb|AAC06948.1| (AE000708) dihydroorotase [Aquifex aeolicus] 
Length = 422 


Identities = 197/303 (65%), Positives = 250/303 (82%) 
gb|AAF72727.1| (AF264709) aspartate transcarbamoylase 
[Enterococcus faecalis] Length = 308 


Identities = 242/355 (68%), Positives = 305/355 (85%) 
emb|CAB89872.1| (AJ132624) carbamoyl phosphate synthetase 
small subunit [Lactococcus lactis] Length = 357 


Identities = 771/1062 (72%), Positives = 900/1062 (84%), Gaps = 
5/1062 (0%) emb|CAA03928.1| (AJ000109) carbamoylphosphate 
synthetase [Lactococcus lactis] Length = 1064 




Identities = 39/130 (30%), Positives = 59/130 (45%), Gaps = 

26/130 (20%) pir||T38271 conserved hypothetical protein 
SPAC23C4.16c - fission yeast (Schizosaccharomyces 
pombe) emb|CAB1 6887.1 1 (Z99753) conserved hypothetical 
protein [Schizosaccharomyces pombe] Length = 424 


Identities = 166/266 (62%), Positives = 207/266 (77%), Gaps = 
2/266 (0%) gb|AAK05380.1|AE006360_9 (AE006360) glutamate 
racemase (EC 5.1.1.3) [Lactococcus lactis subsp. lactis] 
Length = 271 


Identities = 96/189 (50%), Positives = 130/189 (67%), Gaps = 
1/189 (0%) pir||C69986 conserved hypothetical protein ysnA - 
Bacillus subtilis emb|CAA99555.1| (Z75208) hypothetical protein 
[Bacillus subtilis] emb|CAB14796.1| (Z99118) similar to 
hypothetical proteins [Bacillus subtilis] Length = 1 98 
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Identities = 43/75 (57%), Positives = 57/75 (75%), Gaps = 1/75 
(1%) pir||G72251 conserved hypothetical protein - Thermotoga 
maritima (strain MSB8) gb|AAD36530.1|AE001797_10 
(AE001797) conserved hypothetical protein [Thermotoga 
maritima] Length = 81 


identities - 44/1 12. (25%), positives - 80/172 (45%), Gaps = 
27/172 (15%) gb|AAG09969.1|AF248037_4 (AF248037) 
unknown [Streptococcus agalactiae] Length = 174 

Identities = 165/480 (34%), Positives = 261/480 (54%), Gaps = 
10/480 (2%) ref|NP_069673.1 1 TRK potassium uptake system 
protein (trkH) [Archaeoglobus fulgidus] pirj|G69354 TRK 


jArchaeoglobus fulgidus gb|AAB90400.1| (AE001046) TRK 
; potassium uptake system protein (trkH) [Archaeoglobus 
fulgidus] Length = 478 

Identities = 136/446 (30%), Positives = 238/446 (52%), Gaps = 
12/446 (2%) ref|NP_069672.1| TRK potassium uptake system 
protein (trkA-2) [Archaeoglobus fulgidus] 
sp|O29420|TRKA_ARCFU TRK SYSTEM POTASSIUM UPTAKE 


system protein (trkA-2) homolog - Archaeoglobus fulgidus 

gb|AAB90401.1| (AE001046) TRK potassium uptake system 
protein (trkA-2) [Archaeoglobus fulgidus] Length = 
436 

Identities = 91/289 (31%), Positives = 146/289 (50%), Gaps = 
14/289 (4%) sp|P12055|STR_STAAU STREPTOMYCIN 
RESISTANCE PROTEIN pir||S00938 str protein - 
Staphylococcus aureus plasmid pS194 emb|CAA29839.1| 
(X06627) ORF (str) [Staphylococcus aureus] Length = 282 
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Identities = 31/103 (30%), Positives = 57/103 (55%), Gaps = 
4/103 (3%) pir||G75166 hypothetical protein PAB0331 - 
Pyrococcus abyssi (strain Orsay) emb|CAB49414.1| (AJ248284) 
hypothetical protein [Pyrococcus abyssi] Length = 114 


Identities = 32/1 10 (29%), Positives = 54/1 10 (49%), Gaps = 
4/110 (3%) ref|NP_057431.1| putative N-acetyltransferase 
Camello 2 [Homo sapiens] gb|AAF22299.1|AF 185571 J 
(AF1 85571) putative N-acetyltransferase Camello 2 [Homo 
sapiens] Length = 227 


Identities = 42/188 (22%), Positives = 94/188 (49%), Gaps = 
4/188 (2%) pir||B70082 hypothetical protein yxlG - Bacillus subtilis 

dbj|BAA1 1738.1 1 (D83026) hypothetical [Bacillus subtilis] 
emb|CAB15891.1| (Z99123) yxlG [Bacillus subtilis] Length 
= 259 


Identities = 105/301 (34%), Positives = 176/301 (57%), Gaps = 
11/301 (3%) sp|P54592|YHCH BACSU HYPOTHETICAL ABC 
TRANSPORTER ATP-BINDING PROTEIN 2 IN GLPD-CSPB 
INTERGENIC REGION pir||D69822 ABC transporter (ATP- 
binding protein) homolog yhcH - Bacillus subtilis 
emb|CAA65691.1| (X96983) hypothetical protein [Bacillus subtilis] 
emb|CAB12736.1 1 (Z99108) similar to ABC transporter (ATP- 
binding protein) [Bacillus subtilis] Length = 305 


Identities = 39/134 (29%), Positives = 71/134 (52%), Gaps = 
16/134 (11%) gb|AAB71491.1| (U53767) ORF6 [Bacillus pumilus] 
Length = 211 


Identities = 50/186 (26%), Positives = 105/186 (55%), Gaps = 
5/186 (2%) pir||S32217 hypothetical protein 2 - Bacillus 
megaterium emb|CAA79986.1| (Z21972) ORF2 [Bacillus 
megaterium] Length = 216 
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Identities = 225/594 (37%), Positives = 351/594 (58%), Gaps = 
11/594 (1%) sp|P40739|PTBA_BACSU PTS SYSTEM, BETA- 
GLUCOSIDES-SPECIFIC IIABC COMPONENT (EIIABC-BGU 


(BETA-GLUCOSIDES-PERMEASE IIABC COMPONENT) 
(PHOSPHOTRANSFERASE ENZYME II, ABC COMPONENT) 
(Ell-BGL) pir||l40406 beta-glucoside permease - Bacillus subtilis 
emb|CAA84286.1| (Z34526) beta-glucoside permease [Bacillus 
subtilis] Length = 609 


Identities = 195/308 (63%), Positives = 245/308 (79%), Gaps = 
4/308 (1%) sp|P24137|OPPF BACSU OLIGOPEPTIDE 
TRANSPORT ATP-BINDING PROTEIN OPPF pir||E38447 
oligopeptide transport ATP-binding protein oppF - Bacillus subtilis 
gb|AAA62692.1| (M57689) sporulation protein [Bacillus subtilis] 
Lenath = 308 


Identities = 230/342 (67%), Positives = 283/342 (82%), Gaps = 
2/342 (0%) gb|AAF73093.1|AF103793_4 (AF103793) ATPase 
OppD [Listeria monocytogenes] Length = 358 


Identities = 157/325 (48%), Positives = 219/325 (67%), Gaps = 
4/325 (1%) gb|AAF73092.1|AF103793_3 (AF103793) 
transmembrane protein OppC [Listeria monocytogenes] 

I ennth = 344 


Identities = 147/304 (48%), Positives = 221/304 (72%), Gaps = 
1/304 (0%) gb|AAF73091.1|AF103793_2 (AF103793) 
transmembrane protein OppB [Listeria monocytogenes] 


Identities = 352/512 (68%), Positives = 416/512 (80%), Gaps = 
2/512 (0%) gb|AAD1 7886.1 1 (AF1 00456) hyaluronate-associated 
protein precursor [Streptococcus equi] Length = 522 
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Identities = 40/58 (68%), Positives = 46/58 (78%) 
sp|O06444|RL30_STAAU 50S RIBOSOMAL PROTEIN L30 
gb|AAB54020.1| (U96620) ribosomal protein L30 [Staphylococcus 
aureus] Length = 59 


Identities = 116/146 (79%), Positives = 128/146 (87%) 
sp|O06445|RL15_STAAU 50S RIBOSOMAL PROTEIN L15 
gb|AAB54021.1| (U96620) ribosomal protein L15 [Staphylococcus 
aureus] Length = 146 


Identities = 292/433 (67%), Positives = 361/433 (82%), Gaps = 
2/433 (0%) sp|P27148|SECY LACLA PREPROTEIN 
TRANSLOCASE SECY SUBUNIT pir||S17985 preprotein 
translocase secY - Lactococcus lactis subsp. lactis 
emb|CAA41939.1| (X59250) SecY protein [Lactococcus lactis] 
prf||1715214A secY gene [Lactococcus lactis] Length = 439 


Identities = 146/214 (68%), Positives = 170/214 (79%), Gaps = 
6/214 (2%) sp|P27143|KAD_LACLA ADENYLATE KINASE (ATP- 
AMP TRANSPHOSPHORYLASE) pir||S17987 adenylate kinase 
(EC 2.7.4.3) - Lactococcus lactis subsp. lactis pir||B44812 

adenylate kinase (EC 2.7.4.3) - Lactococcus lactis 
emb|CAA41940.1| (X59250) adenylate kinase [Lactococcus 
lactis] Length = 215 
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Identities = 51/213 (23%), Positives = 89/213 (40%), Gaps = 

32/213 (15%) pir||T19214 UDP-glucose-glycoprotein 
glucosyltransferase (EC 2.4.1 .-) precursor F26H9.8 - 
Caenorhabditis elegans emb|CAB03874.1| (Z81467) predicted 
using Genefinder~Similarity to Drosophila UDP- 
glucose:glycoprotein glucosyltransferase (TR:Q09332), 
contains similarity to Pfam domain: PF01501 (Glycosyl 
transferase family 8), Score=-22.6, E-value=4.8e-05, 
N=1~cDNA ESTyk250b10.3 co> emb|CAB04207.1| (Z81516) 
predicted using Genefinder~Similarity to Drosophila UDP- 
glucose:glycoprotein glucosyltransferase (TR:Q09332), 
contains similarity to Pfam domain: PF01501 (Glycosyl 
transferase family 8), Score=-22.6, E-value=4.8e-05, 
N=1 ~cDNA EST yk250b1 0.3 co> Length = 1 377 


Identities = 324/433 (74%), Positives = 357/433 (83%) 
dbj|BAB04344.1| (AP001509) adenylosuccinate lyase [Bacillus 
halodurans] Length = 433 




Identities = 1 96/322 (60%), Positives = 254/322 (78%) 
sp|O32055|RUVB_BACSU HOLLIDAY JUNCTION DNA 
HELICASE RUVB emb|CAB75331.1| (Y15896) RuvB protein 
[Bacillus subtilis] Length = 334 


Identities = 140/305 (45%), Positives = 191/305 (61%), Gaps = 
6/305 (1%) sp|Q47690|MMUM ECOLI HOMOCYSTEINE S- 
METHYLTRANSFERASE (S- 
METHYLMETHIONINE:HOMOCYSTEINE 
METHYLTRANSFERASE) pir[|E64751 probable membrane 
protein yagD - Escherichia coli gb|AAB08682.1| (U70214) similar 

to S. cerevisiae YLL062c [Escherichia coli] gb|AAC73364.1| 
(AE0001 34) putative enzyme [Escherichia coli K12] Length 
| =310 
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Identities = 101/278 (36%), Positives = 160/278 (57%), Gaps = 
1/278 (0%) sp|Q54087|LRPR_STREQ LEUCINE RICH PROTEIN 

pir||S39972 leucine-rich protein - Streptococcus equisimilis 
emb|CAA51350.1| (X72832) leucine rich protein [Streptococcus 
equisimilis] prf||2009358B Leu-rich protein [Streptococcus 
equisimilis] Length = 282 


Identities = 320/377 (84%), Positives = 359/377 (94%) 
sp|Q00752|MSMK_STRMU MULTIPLE SUGAR-BINDING 
TRANSPORT ATP-BINDING PROTEIN MSMK pir||E42400 ABC- 
type transport system ATP-binding protein msmK [validated] - 
Streptococcus mutans gb|AAA26938.1| (M77351) ATP-binding 
protein [Streptococcus mutans] Length = 377 


Identities = 342/399 (85%), Positives = 378/399 (94%) 
emb|CAC21180.1| (AJ251799) putative phosphopentomutase 
[Streptococcus thermophilus] Length = 403 


Identities = 99/199 (49%), Positives = 140/199 (69%), Gaps = 
1/199 (0%) sp|P43048|DEOC_MYCHO DEOXYRIBOSE- 
PHOSPHATE ALDOLASE (PHOSPHODEOXYRIBOALDOLASE) 
(DEOXYRIBOALDOLASE) pir||S42197 deoxyribose-phosphate 
aldolase (EC 4. 1 .2.4) - Mycoplasma hominis (SGC3) 
pir||S72522 deoxyribose-phosphate aldolase (EC 4.1.2.4) - 
Mycoplasma hominis (SGC3) emb|CAA81646.1| (Z27121) 
deoxyribose aldolase [Mycoplasma hominis] Length = 217 


Identities = 160/405 (39%), Positives = 256/405 (62%), Gaps = 
8/405 (1%) dbj|BAB05165.1| (AP001512) nucleoside transporter 
[Bacillus halodurans] Length = 406 










CO 




18 m) 






54 p) 


01 p) 


I 




q> 




















6066 


533C 


o 
























o> 






Con 


Con 






O 


o 
O 


o 
O 


1915.1 


1916.2 






1918.2 . 


1919.1 


1921.1 


& 


& 






& 


& 


ih 




00 






O) 

cn 


o 
o> 




Q 


Q 






Q 


a 


Q 


Seql 


Seql 






Seql 


Seql 


Seql 



WO 02/092818 



165 



PCT/IB02/03059 




WO 02/092818 PCT/IB02/03059 




WO 02/092818 



167 



PCT/IB02/03059 




WO 02/092818 



168 



PCT/IB02/03059 




WO 02/092818 



169 



PCT/IB02/03059 




PCT/IB02/03059 




WO 02/092818 



171 



PCT/IB02/03059 




WO 02/092818 



172 



PCT/IB02/03059 




WO 02/092818 



173 



PCT/IB02/03059 




WO 02/092818 



174 



PCT/IB02/03059 




WO 02/092818 



175 



PCT/IB02/03059 




WO 02/092818 



176 



PCT/IB02/03059 




WO 02/092818 



177 



PCT/IB02/03059 




PCT/IB02/03059 




PCT/IB02/03059 









Identities = 50/110 (45%), Positives = 76/110 (68%) 
ref|NP_054018.1| CadX [Staphylococcus lugdunensis] 
gb|AAB1 8271 :1 |-(U74623) CadX [Staphylococcus lugdunensis] 
Length = 115 


Identities = 198/209 (94%), Positives = 203/209 (96%) 
pir||E81967 cadmium resistance protein NMA0496 [imported] - 
Neisseria meningitidis (group A strain Z2491 ) 
emb|CAB83789.1| (AL162753) cadmium resistance protein 
[Neisseria meningitidis Z2491] Length = 213 


Identities = 171/393 (43%), Positives = 256/393 (64%), Gaps = 

2/393 (0%) gb|AAK06200.1|AE006438 14 (AE006438) 
HYPOTHETICAL PROTEIN [Lactococcus lactis subsp. lactis] 
Length = 400 


Identities = 186/500 (37%), Positives = 258/500 (51%), Gaps = 
67/500 (13%) emb|CAB95221.1| (AL359773) possible threonine 
synthase [Leishmania major] Length = 676 


Identities = 238/340 (70%), Positives = 276/340 (81%), Gaps = 

2/340 (0%) pir||H81 186 alcohol dehydrogenase, propanol- 
preferring NMB0546 [imported] - Neisseria meningitidis 
(group B strain MD58) gb]AAF40975.1| (AE002410) alcohol 
dehydrogenase, propanol-preferring [Neisseria 
meningitidis MC58] Length = 348 




Identities = 658/873 (75%), Positives = 760/873 (86%), Gaps = 
2/873 (0%) gb|AAK03537.1| (AE006181) Adh2 [Pasteurella 
multocida] Length = 875 


Identities = 68/155 (43%), Positives = 98/155 (62%) 
gb|AAF13747.1|AF117351_4 (AF117351) unknown [Zymomonas 
mobilis] Length = 236 
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Identities = 227/341 (66%), Positives = 278/341 (80%) 
sp|O32054|QUEA BACSU S-ADENOSYLMETHIONINE:TRNA 
RIBOSYLTRANSFERASE-ISOMERASE (QUEUOSINE 
BIOSYNTHESIS PROTEIN QUEA) pir||A69688 S- 
adenosylmethionine-tRNA ribosyltransferase-isomerase (EC 
5.4.99.-) queA [similarity] - Bacillus subtilis emb|CAB14732.1| 
(Z991 18) S-adenosylmethionine tRNA ribosyltransferase [Bacillus 
subtilis] emb|CAB75332.1| (Y15896) QueA protein [Bacillus 
subtilis] Length = 342 


Identities = 56/145 (38%), Positives = 86/145 (58%), Gaps = 
2/145 (1%) emb|CAA73494.1| (Y13052) ORF145 
[Staphylococcus sciuri] Length = 145 




Identities = 232/416 (55%), Positives = 314/416 (74%), Gaps = 
3/416 (0%) sp|Q57493|Y092_HAE!N HYPOTHETICAL PROTEIN 
HI0092 pir||D64142 hypothetical protein HI0092 - Haemophilus 
influenzae (strain Rd KW20) gb|AAC21770.1| (U32694) 
H. influenzae predicted coding region HI0092 [Haemophilus 
influenzae Rd] Length = 419 


Identities = 177/367 (48%), Positives = 235/367 (63%), Gaps = 

2/367 (0%) gb|AAG58254.1|AE005541_6 (AE005541) orf, 
hypothetical protein [Escherichia coli 0157:H7] Length = 
387 




Identities = 94/370 (25%), Positives = 184/370 (49%), Gaps = 
13/370 (3%) dbj|BAB06450.1| (AP001516) unknown conserved 
protein [Bacillus halodurans] Length = 371 


Identities = 334/475 (70%), Positives = 392/475 (82%), Gaps = 
8/475 (1%) gb|AAF89979.1|AF206272_5 (AF206272) beta- 
glucosidase [Streptococcus mutans] Length = 479 
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Identities = 148/349 (42%), Positives = 223/349 (63%), Gaps = 
16/349 (4%) sp|O05252|YUFN BACSU HYPOTHETICAL 
LIPOPROTEIN YUFN PRECURSOR pir||C70009 ABC 
transporter (lipoprotein) homolog yufN - Bacillus subtilis 


emb|CAB07936.1| (Z93937)"unknown [Bacillus subtilis] 
emb|CAB15143.1| (Z99120) similar to ABC transporter 
(lipoprotein) [Bacillus subtilis] Length = 350 


Identities = 56/262 (21%), Positives = 121/262 (45%), Gaps = 
28/262 (10%) gb|AAF72344.1|AF192329_5 (AF192329) unknown 
[Enterococcus faecalis] Length = 287 

Identities = 263/299 (87%), Positives = 287/299 (95%) 
dbj|BAA28714.1| (AB001562) glucose-1-phosphate 
uridylyltransferase [Streptococcus mutans] Length = 
306 


sp|P46919jGPDA_BACSU GLYCEROL-3-PHOSPHATE 
DEHYDROGENASE [NAD(P)+] (NAD(P)H-DEPENDENT 
DIHYDROXYACETONE-PHOSPHATE REDUCTASE) 
gb|AAA86746.1| (U32164) NAD(P)H-dependent 
dihydroxyacetone-phosphate reductase [Bacillus subtilis] 
Length = 345 

Identities = 52/109 (47%), Positives = 77/109 (69%), Gaps = 
1/109 (0%) pdb|1A6F| Rnase P Protein From Bacillus Subtilis 
Length = 119 
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Identities = 100/451 (22%), Positives = 180/451 (39%), Gaps = 
81/451 (17%) emb|CAB39034.1| (AL034559) hypothetical protein, 
PFC0940c [Plasmodium falciparum] Length = 806 
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Identities = 100/317 (31%), Positives = 168/317 (52%), Gaps = 
-8/317 (2%) dbj|BAB05608.1| (AP001513) unknown conserved 
protein [Bacillus haiodurans] Length = 325 










Identities = 35/91 (38%), Positives = 51/91 (55%) 
sp|P34159|YHS1_CLOAB HYPOTHETICAL 11.0 KD PROTEIN 
IN HSP18 3 REGION (ORFA1) emb|CAA46375.1| (X65276) 
ORFA1 [Clostridium acetobutylicum] Length = 96 












Identities = 260/311 (83%), Positives = 283/311 (90%) 
sp|P95765|PPAC STRGC PROBABLE MANGANESE- 
DEPENDENT INORGANIC PYROPHOSPHATASE 
(PYROPHOSPHATE PHOSPHO-HYDROLASE) (PPASE) 
gb|AAB39104.1| (U57759) intrageneric coaggregation-relevant 
adhesin [Streptococcus gordonii] Length = 311 


Identities = 261/793 (32%), Positives = 436/793 (54%), Gaps = 
36/793 (4%) gb|AAF72347.1|AF192329_8 (AF1 92329) TrsE-like 
protein [Enterococcus faecalis] Length = 799 


Identities = 185/260 (71%), Positives = 218/260 (83%) 
sp|068575jPFLA STRMU PYRUVATE FORMATE-LYASE 
ACTIVATING ENZYME (PFL-ACTIVATING ENZYME) 
gb|AAC05773.1| (AF051356) pyruvate-formate lyase activating 
enzyme [Streptococcus mutans] dbj|BAA34998.1| 
(AB018417) PFL-activating enzyme [Streptococcus mutans] 
Length = 263 
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Identities = 311/518,(60%), Positives = 393/518 (75%), Gaps = 
9/518 (1%) sp|O86490|RF3_STAAU PEPTIDE CHAIN RELEASE 
FACTOR 3 (RF-3) emb|CAA74739.1 1 (Y14370) peptide chain 
release factor 3 [Staphylococcus aureus] Length = 521 


Identities = 92/358 (25%), Positives = 142/358 (38%), Gaps = 
55/358 (15%) gb|AAG54632.1|AE005207_7 (AE005207) putative 
adhesin [Escherichia coli 0157:H7] Length = 1417 


Identities = 243/373 (65%), Positives = 302/373 (80%), Gaps = 

1/373 (0%) sp|P34001|YWAP_STRMU HYPOTHETICAL 
PROTEIN IN WAPA 3 REGION pir||S06993 hypothetical protein 
(wapA 3 region) - Streptococcus mutans (fragment) 
gb|AAA88609.1| (M37842) unknown protein [Streptococcus 


Identities = 432/556 (77%), Positives = 492/556 (87%) 
sp|Q59925|FTHS STRMU FORMATE-TETRAHYDROFOLATE 
LIGASE (FORMYLTETRAHYDROFOLATE 
SYNTHETASE) (FHS) (FTHFS) gb|AAB49329.1| (U39612) 
formyl-tetrahydrofolate synthetase [Streptococcus mutans] 


Identities = 131/331 (39%), Positives = 207/331 (61%), Gaps = 
5/331 (1%) pir||G69830 lipoate-protein ligase homolog yhfJ - 
Bacillus subtilis emb|CAA74531 . 1 1 (Y14083) hypothetical protein 
[Bacillus subtilis] emb|CAB12865.1| (Z99109) similar to lipoate- 
protein ligase [Bacillus subtilis] Length = 331 


Identities = 228/571 (39%), Positives = 347/571 (59%), Gaps = 
24/571 (4%) pir||E81869 probable ATP-dependent proteinase 
ATP-binding protein NMA1045 [imported] - Neisseria 
meningitidis (group A strain Z2491) emb|CAB84311.1| 
(AL1 62755) putative ATP-dependent protease ATP-binding 
protein [Neisseria meningitidis] Length = 759 
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Identities = 105/240 (43%), Positives = 147/240 (60%), Gaps = 
2/240-(0%) sp|Q929J0|TRUA BACHD TRNA PSEUDOURIDINE 
SYNTHASE A (PSEUDOURIDYLATE SYNTHASE I) 
(PSEUDOURIDINE SYNTHASE I) (URACIL HYDROLYASE) 
pir||T44415 pseudouridylate synthase I truA [imported] - Bacillus 
halodurans dbj|BAA75303.1| (AB017508) truA homologue 
(identity of 62 to B. subtilis%) [Bacillus halodurans] 
dbj|BAB03886.1| (AP001507) tRNA pseudouridine synthase A 
(pseudouridylate synthase I) [Bacillus halodurans] 
Length = 263 


Identities = 173/347 (49%), Positives = 241/347 (68%), Gaps = 
3/347 (0%) gb|AAD24445.1|AF118389_2 (AF1 18389) unknown 
[Streptococcus suis] Length = 419 


Identities = 162/270 (60%), Positives = 202/270 (74%), Gaps = 
3/270 (1%) dbj|BAB06497.1| (AP001516) hemolysin-like protein 
[Bacillus halodurans] Length = 272 


Identities = 49/153 (32%), Positives = 84/153 (54%), Gaps = 
4/153 (2%) emb|CAA09426.1| (AJ010954) arginine repressor 
[Bacillus stearothermophilus] Length = 149 


Identities = 245/567 (43%), Positives = 366/567 (64%), Gaps = 
18/567 (3%) sp|P17894|RECN_BACSU DNA REPAIR PROTEIN 
RECN (RECOMBINATION PROTEIN N) pir||B35128 DNA repair 
and genetic recombination protein recN - Bacillus subtilis 
gb|AAA22691.1| (M30297) recombination protein (ttg start codon) 
I [Bacillus subtilis] dbj|BAA12579.1| (D84432) RecN 
[Bacillus subtilis] emb|CAB14355.1| (Z99116) recN [Bacillus 
subtilis] Length = 576 


Identities = 93/277 (33%), Positives = 152/277 (54%), Gaps = 
4/277 (1%) dbj|BAB07346.1| (AP001519) unknown conserved 
protein [Bacillus halodurans] Length = 283 
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Identities = 123/231 (53%), Positives = 174/231 (75%), Gaps = 
7/231 (3%) pir||T00087 rhamnosyltransferase-- Streptococcus 
mutans dbj|BAA32090.1l (AB010970) rhamnosyltransferase 
[Streptococcus mutans] Length = 311 


Identities = 77/118 (65%), Positives = 102/118 (86%) 
gb|AAK04289.1|AE006256_11 (AE006256) HYPOTHETICAL 
PROTEIN [Lactococcus lactis subsp. lactis] Length = 122 


Identities = 354/539 (65%), Positives = 438/539 (80%), Gaps = 

8/539 (1%) gb|AAK04288.1|AE006256_10 (AE006256) 
HYPOTHETICAL PROTEIN [Lactococcus lactis subsp. lactis] 
Length = 535 


Identities = 127/275 (46%), Positives = 174/275 (63%), Gaps = 
1/275 (0%) gb|AAF68390.1|AF236374_1 (AF236374) 
hypersensitive-induced response protein [Zea mays] 
Length = 284 


Identities = 39/1 10 (35%), Positives = 55/1 10 (49%), Gaps = 

3/110 (2%) pir||G72536 hypothetical protein APE1580 - 
Aeropyrum pernix (strain K1) dbj|BAA80580.1| (AP000062) 
1 14aa long hypothetical protein [Aeropyrum pernix] Length 

i = 114 


Identities = 132/241 (54%), Positives = 178/241 (73%), Gaps = 
1/241 (0%) pir||F81363 probable glutamine transport ATP-binding 
protein Cj0902 [imported] - Campylobacter jejuni (strain 
NCTC 11168) emb|CAB73160.1| (AL1 39076) putative glutamine 

transport ATP-binding protein [Campylobacter jejuni] 
| Length = 242 


Identities = 147/534 (27%), Positives = 255/534 (47%), Gaps = 
75/534 (14%) pir||S77250 hypothetical protein - Synechocystis sp. 
(strain PCC 6803) dbj|BAA17584.1| (D90907) glutamine-binding 
periplasmic protein [Synechocystis sp.] Length = 530 
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Identities = 35/95 (36%), Positives = 56/95 (58%), Gaps = 3/95 

(3%) sp|P46339|YQGH BACSU PROBABLE ABC 
TRANSPORTER PERMEASE PROTEIN YQGH pir||B69956 
phosphate ABC transporter (permease) homoiog yqgH - Bacillus 
subtilis dbj|BAA09582.1| (D58414) ORF72 [Bacillus subtilis] 
dbj|BAA1251 1.1 1 (D84432) YqgH [Bacillus subtilis] 
emb|CAB14428.1| (Z99116) alternate gene name: yzmC~similar 
to phosphate ABC transporter (permease) [Bacillus 
subtilis] Length = 309 


Identities = 35/54 (64%), Positives = 44/54 (80%) 
sp|P46339|YQGH_BACSU PROBABLE ABC TRANSPORTER 

PERMEASE PROTEIN YQGH pir||B69956 phosphate ABC 
transporter (permease) homoiog yqgH - Bacillus subtilis 
dbj|BAA09582.1| (D58414) ORF72 [Bacillus subtilis] 
dbj|BAA12511.1| (D84432) YqgH [Bacillus subtilis] 
emb|CAB1 4428.1 1 (Z99116) alternate gene name: yzmC~similar 
to phosphate ABC transporter (permease) [Bacillus 
subtilis] Length = 309 


Identities = 78/161 (48%), Positives = 113/161 (69%), Gaps = 

1/161 (0%) sp|P46339|YQGH BACSU PROBABLE ABC 
TRANSPORTER PERMEASE PROTEIN YQGH pir||B69956 
phosphate ABC transporter (permease) homoiog yqgH - Bacillus 
subtilis dbj|BAA09582.1| (D58414) ORF72 [Bacillus subtilis] 
dbj|BAA12511.1| (D84432) YqgH [Bacillus subtilis] 
emb|CAB14428.1| (Z99116) alternate gene name: yzmC~similar 
to phosphate ABC transporter (permease) [Bacillus 
subtilis] Length = 309 










"2 
o 


00 


? 




o 


(9163 


(9422 


9663 


s 






ntig' 




ntig' 


- Co 


Cc 


Co 








-225 




I 




< 

CO 




CO 






SeqID 12 


SeqID 12 


SeqID 12 



WO 02/092818 PCT/IB02/03059 



Identities = 157/294 (53%), Positives = 225/294 (76%) 
sp|P46340|YQGI BACSU PROBABLE ABC TRANSPORTER 

PERMEASE PROTEIN YQGI pir||C69956 phosphate ABC 
transporter (permease) homolog yqgl - Bacillus subtilis 
dbj|BAA09583.1| (D58414.) ORF73 [Bacillus subtilis] 
dbj|BAA12512.1| (D84432) Yqgl [Bacillus subtilis] 
emb|CAB1 4427.1 1 (Z99116) alternate gene name: yzmD~similar 
to phosphate ABC transporter (permease) [Bacillus 
subtilis] Length = 294 


Identities = 154/247 (62%), Positives = 204/247 (82%) 
sp|Q58418|PSTB_METJA PROBABLE PHOSPHATE 
TRANSPORT ATP-BINDING PROTEIN PSTB pir||C64426 

phosphate transport system ATP-binding protein - 
Methanococcus jannaschii gb|AAB99016.1| (U67544) 
phosphate specific transport complex component (pstB) 
[Methanococcus jannaschii] Length = 252 


Identities = 148/248 (59%), Positives = 189/248 (75%) 
sp|P46341|YQGJ BACSU HYPOTHETICAL ABC 
TRANSPORTER ATP-BINDING PROTEIN YQGJ pir||D69956 
phosphate ABC transporter (ATP-binding pro) homolog yqgJ - 
Bacillus subtilis dbj|BAA09584.1 1 (D58414) ORF74 
[Bacillus subtilis] dbj|BAA12513.1| (D84432) YqgJ [Bacillus 
subtilis] emb|CAB14426.1| (Z99116) alternate gene name: 
yzmE~similar to phosphate ABC transporter (ATP-binding 
protein) [Bacillus subtilis] Length = 269 


Identities = 116/217 (53%), Positives = 167/217 (76%) 
gb|AAK05813.1|AE006402_1 (AE006402) phosphate transport 
system regulator [Lactococcus lactis subsp. lactis] 
Length = 217 
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Identities = 107/531 (20%), Positives = 224/531 (42%), Gaps = 
62/531 (11%) ref|NP_070647.1 1 A. fulgidus predicted coding 
region AF1820 [Archaeoglobus fulgidus] pir||C69477 hypothetical 
protein AF1 820 - Archaeoglobus fulgidus gb|AAB89436.1| 
(AE000977) A. fulgidus predicted coding region AF1820 
[Archaeoglobus fulgidus] Length = 791 


Identities = 1 12/230 (48%), Positives = 167/230 (71%) 
ref|NP_070646.1| ABC transporter, ATP-binding protein 
[Archaeoglobus fulgidus] pir||B69477 ABC transporter, ATP- 
binding protein homolog - Archaeoglobus fulgidus 
gb|AAB89431.1| (AE000977) ABC transporter, ATP-binding 
protein [Archaeoglobus fulgidus] Length = 231 


Identities = 278/469 (59%), Positives = 355/469 (75%), Gaps = 
10/469 (2%) sp|Q9KA23|TOP1 BACHD DNA 
TOPOISOMERASE I (OMEGA-PROTEIN) (RELAXING 
ENZYME) (UNTWISTING ENZYME) (SWIVELASE) 
dbj|BAB06186.1| (AP001515) DNA topoisomerase I [Bacillus 
halodurans] Length = 690 




Identities = 126/284 (44%), Positives = 185/284 (64%) 
sp|P37550|ISPE BACSU 4-DIPHOSPHOCYTIDYL-2-C-METHYL 
D-ERYTHRITOL KINASE (CMK) (4-(CYTIDINE-5 - 
DIPHOSPHO)-2-C-METHYL-D-ERYTHRITOL KINASE) 
pir||S66075 conserved hypothetical protein yabH - Bacillus subtilis 
dbj|BAA05281.1| (D26185) unknown [Bacillus subtilis] 
emb|CAB1 1822.1 1 (Z99104) similar to hypothetical proteins 
[Bacillus subtilis] Length = 289 


Identities = 77/146 (52%), Positives = 117/146 (79%) pir||T46753 
repressor protein adcR [imported] - Streptococcus pneumoniae 
emb|CAA96184.1l (Z71552) AdcR protein [Streptococcus 
pneumoniae] Length = 146 
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Identities = 54/192 (28%), Positives = 89/192 (46%), Gaps = 
14/192 (7%) sp|P50736|YPDA BACSU HYPOTHETICAL 36.3 
KD PROTEIN IN RECQ-CMK INTERGENIC REGION 
pir||A69934 thioredoxin reductase homolog ypdA - Bacillus 
subtilis gb|AAC83954.1| (L47648) putative [Bacillus subtilis] 
emb|CAB14211.1| (Z99115) similar to thioredoxin reductase 

[Bacillus subtilis] emb|CAB14227.1| (Z99116) similar to 
thioredoxin reductase [Bacillus subtilis] Length = 324 


Identities = 213/322 (66%), Positives = 260/322 (80%), Gaps = 
5/322 (1%) gb|AAB81912.1| (U92974) unknown [Lactococcus 
lactis] Length = 319 




Identities = 174/321 (54%), Positives = 241/321 (74%), Gaps = 

4/321 (1%) pir||JC5050 sugar phosphate transport protein - 
Shigella flexneri gb|AAC44575.1| (U28354) 1S629 ORFB fused 
with sequences similar to E. coli GIpT and UhpT proteins, 
Swiss-Prot Accession Number P08194 and P09836; 
Method: conceptual translation supplied by author 
[Shigella flexneri] Length = 333 


Identities = 23/57 (40%), Positives = 36/57 (62%) 
ref|NP_049417.1| putative cro-like regulatory protein 
[Streptococcus thermophilus bacteriophage DT1] 
gb|AAD21 905.1] (AF085222) putative cro-like regulatory protein 
[Streptococcus thermophilus bacteriophage DT1] 
Length = 67 


Identities = 112/253 (44%), Positives = 161/253 (63%), Gaps = 

1/253 (0%)sp|Q9RGS6|THIM STACA 
HYDROXYETHYLTHIAZOLE KINASE (4-METHYL-5-BETA- 
HYDROXYETHYLTHIAZOLE KINASE) (THZ KINASE) 
(TH KINASE) gb|AAF25543.1|AF109218_3 (AF109218) ThiM 
[Staphylococcus carnosus] Length = 264 
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Identities = 139/258 (53%), Positives = 186/258 (71%), Gaps = 
4/258 (1%) gb|AAF25542.1|AF109218_2 (AF109218) ThiD 
[Staphylococcus carnosus] Length = 273 


Identities = 74/213 (34%), Positives = 122/213 (56%), Gaps = 
13/213 (6%) gb|AAF25541.1|AF109218_1 (AF109218) TenA 
[Staphylococcus carnosus] Length = 228 




Identities = 48/216 (22%), Positives = 98/216 (45%), Gaps = 
3/216 (1%) emb|CAA91230.1| (Z56283) orf2 [Lactobacillus 
helveticus] Length = 217 


Identities = 189/462 (40%), Positives = 313/462 (66%) 
emb|CAB52225.1| (Z98171) EpsU protein [Streptococcus 
thermophilus] Lenqth = 471 




Identities = 53/116 (45%), Positives = 75/116 (63%), Gaps = 
4/116 (3%) gb|AAF1 8951 . 1 |AF1 55805_5 (AF155805) Cps9H 
[Streptococcus suis] Length = 143 


Identities = 99/260 (38%), Positives = 157/260 (60%), Gaps = 
3/260 (1%) pir|]S45085 hypothetical protein zeta - Streptococcus 
pyogenes plasmid pDB101 and pBT233 pir||S68606 
hypothetical protein zeta - Streptococcus pyogenes plasmid 
pBT233 emb|CAA45934.1| (X64695) ORF zeta [Streptococcus 
pyogenes] emb|CAA47091 .1 1 (X66468) orf zeta [Streptococcus 
pyogenes] emb!CAA47092.1| (X66468) orf zeta [Streptococcus 
pyogenes] Length = 287 






No Hits found 




s 


No Hits found 




2? 


(1486-2283 p) 


(805-1461 p) 


(181-306 p) 


0 (20-721 p) 


9386-10810 p) 


(8022-9386 p) 


(7073-8020 p) 


0561-31331 m) 


Contig130 


Contig130 


8 


Contig13 


Contig101 ( 


o 
O 


Contig101 


Contig136(3 


SA-2381.1 


<fc 

CO 


SA-2383. 1 | 


3 
< 

CO 


SA-2386. 1 


SA-2387. 1 


SA-2388.2 


SA-239.1 


• SeqID 1391 


SeqID 1392 


SeqID 1393 


SeqID 1394 


SeqID 1395 


SeqID 1396 j 


SeqID 1397 


SeqID 1398 



WO 02/092818 



220 



PCT/IB02/03059 



Identities = 178/535 (33%), Positives = 269/535 (50%), Gaps = 
55/535 (10%) sp|P54602|YHCR_BACSU HYPOTHETICAL 132.7 
KDA PROTEIN IN CSPB-GLPP INTERGENIC REGION 
pir||F69823 probable phosphoesterase (EC 3.1.-.-) yhcR - 
Bacillus subtilis emb|CAA65702.1| (X96983) hypothetical protein 
[Bacillus subtilis] emb|CAB12747.1| (299108) similar to 5 - 
nucleotidase [Bacillus subtilis] Length = 1217 


Identities = 72/136 (52%), Positives = 96/136 (69%) 
sp|O08450|DEF_CLOBE POLYPEPTIDE DEFORMYLASE (PDF) 
(FORMYLMETHIONINE DEFORMYLASE) emb|CAB09662.1| 
(Z96934) peptide deformylase [Clostridium beijerinckii] 
Length = 136 


Identities = 292/436 (66%), Positives = 356/436 (80%), Gaps = 
2/436 (0%) dbj|BAB05820.1| (AP001514) NADP-specific 
glutamate dehydrogenase [Bacillus halodurans] 
Length = 458 


Identities = 63/243 (25%), Positives = 120/243 (48%) 
dbj|BAB03800.1[ (AP001507) BH0081 -unknown conserved 
protein in others [Bacillus halodurans] Length = 251 


Identities = 352/509 (69%), Positives = 421/509 (82%), Gaps = 
1/509 (0%) pir||D69813 ABC transporter (ATP-binding protein) 

homolog yfmM - Bacillus subtilis dbj|BAA22327.1| 
(D86417) YfmM [Bacillus subtilis] emb|CAB12571.1| (Z99108) 

similar to ABC transporter (ATP-binding protein) [Bacillus 
subtilis] Length = 518 


Identities = 138/358 (38%), Positives = 220/358 (60%), Gaps = 
18/358 (5%) pir||E71373 probable regulatory protein (pfoS/R) - 
syphilis spirochete gb|AAC65034. 1 1 (AE001189) regulatory 
protein (pfoS/R) [Treponema pallidum] Length = 350 
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Identities = 143/196 (72%), Positives = 165/196 (83%), Gaps = 
1/196 (0%) sp|Q00579|RECU_STROR RECOMBINATION 
PROTEIN U HOMOLOG gb|AAA26957.1| (M90528) ORF 
[Streptococcus oralis] Length = 198 


Identities = 82/104 (78%), Positives = 92/104 (87%) 
gb|AAK05177.1|AE006340_10 (AE006340) 50S ribosomal 
protein L21 [Lactococcus lactis subsp. lactis] Length 
= 104 


Identities = 38/107 (35%), Positives = 61/107 (56%), Gaps = 

5/107(4%)gb|AAK05178.1|AE006340 11 (AE006340) 
HYPOTHETICAL PROTEIN [Lactococcus lactis subsp. lactis] 
Lenath = 111 


Identities = 70/90 (77%), Positives = 80/90 (88%) 
sp|P05657|RL27_BACSU 50S RIBOSOMAL PROTEIN L27 
(BL30) (BL24) pir||C21895 ribosomal protein L27 - Bacillus 
subtiiis emb|CAA26492.1| (X02656) homologous to E.coli 

ribosomal protein L27 [Bacillus subtiiis] 
emb|CAB1 4754.1 1 (Z99118) ribosomal protein L27 (BL24) 
[Bacillus subtiiis] Length = 94 


Identities = 105/297 (35%), Positives = 164/297 (54%), Gaps = 
4/297 (1%) pir||T44638 capsular polysaccharide biosynthesis 
protein cpsY [imported] - Streptococcus agalactiae 
emb|CAB36980.1| (Y17218) CpsY protein [Streptococcus 

agalactiae] emb|CAB36982.2| (Y17241) CpsY protein 
[Streptococcus agalactiae] gb|AAD53064.1|AF163833 1 
(AF1 63833) CpsY [Streptococcus agalactiae] Length = 307 


Identities = 61/144 (42%), Positives = 94/144 (64%), Gaps = 
1/144 (0%) sp|Q48729|LSPA_LACLC LIPOPROTEIN SIGNAL 
PEPTIDASE (PROLIPOPROTEIN SIGNAL PEPTIDASE) 
(SIGNAL PEPTIDASE II) (SPASE II) Length = 150 
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Identities = 363/445 (81%), Positives = 408/445 (91%) 
sp|Q56T15|PEPC_STRTR AMINOPEPTIDASE C pir||S48143 

cysteine aminopeptidase C - Streptococcus thermophilus 
emb|CAA82960.1| (Z30315) aminopeptidase C [Streptococcus 

- - thermophilus] Length = 445 


Identities = 97/188 (51%), Positives = 133/188 (70%) 
gb|AAC1 8360.1 1 (AF064763) putative membrane spanning 
protein [Lactococcus lactis subsp. cremoris] Length 
= 196 


Identities = 106/246 (43%), Positives = 150/246 (60%), Gaps = 
7/246 (2%) pir||G69984 rRNA methylase homolog ysgA - Bacillus 


subtilis emb|CAA99602.1| (Z75208) hypothetical protein [Bacillus 
subtilis] emb|CAB14825.1| (Z99118) similar to rRNA methylase 
[Bacillus subtilis] Length = 248 


Identities = 35/91 (38%), Positives = 54/91 (58%), Gaps = 3/91 
(3%) pir||G72240 hypothetical protein TM1564 - Thermotoga 

maritima (strain MSB8) gb|AAD36630.1|AE001801_17 
(AE001801) acylphosphatase, putative [Thermotoga maritima] 
Length = 90 


Identities = 140/307 (45%), Positives = 201/307 (64%), Gaps = 

19/307 (6%) gb|AAK04667.1|AE006291_1 (AE006291) 
conserved hypothetical protein [Lactococcus lactis subsp. 
lactis] Length = 307 
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Identities = 42/105 (40%), Positives = 62/105 (59%) 
sp|P45678iPEB1_CAMJE MAJOR CELL-BINDING FACTOR 
PRECURSOR (CBF1) (PEB1) pir||A48518 probable ABC-type 
amino-acid transporter periplasmic solute-binding protein 
Cj0921c precursor [imported] - Campylobacter jejuni 
(strain NCTC 11168) gb|AAA02919.1| (L13662) major cell- 
binding factor [Campylobacter jejuni] emb|CAB73178.1| 
(AL1 39076) probable ABC-type amino-acid transporter 
periplasmic solute-binding protein [Campylobacter jejuni] 
Length = 259 


Identities = 112/226 (49%), Positives = 161/226 (70%), Gaps = 
3/226 (1%) pir||G81365 probable ABC-type amino-acid 
transporter permease protein Cj0920c [imported] - 
Campylobacter jejuni (strain NCTC 11168) emb|CAB73177.1| 
(AL1 39076) putative ABC-type amino-acid transporter permease 
protein [Campylobacter jejuni] Length = 250 


Identities = 85/216 (39%), Positives = 132/216 (60%), Gaps = 
6/216 (2%) pir||F69633 glutamine ABC transporter (membrane 
protein) glnP - Bacillus subtilis emb|CAB14687.1| 
(Z991 17) glutamine ABC transporter (integral membrane protein) 
[Bacillus subtilis] emb|CAB14704.1| (Z99118) glutamine ABC 
transporter (integral membrane protein) [Bacillus subtilis] 
Length = 218 


Identities = 43/157 (27%), Positives = 83/157 (52%), Gaps = 
9/157 (5%)dbj|BAB04094.1| (AP001508) BH0375~unknown 
conserved protein in B. subtilis [Bacillus halodurans] 
Length = 194 












nd J 




OO 
CD 


8 




No Hits fou 


-189870 m) 


-189453 m) 


-188746 m) 


-188047 p) 


-187314 p) J 


3139(189466 


]139 (188758 


CD 
O 


3139(187481 


3139(186295 


O 


Contic 


§ 


Contii 


Contic 


465.1 


466.1 


CD 


468.2 


469.2 I 


I 


1 


< 
CO 


SA-2. 


< 

CO 


1466 


1467 


1468 


1469 


1470 I 


SeqID 


SeqID 


SeqID 


SeqID 


Q 

1 



WO 02/092818 



230 



PCT/IB02/03059 




PCT/IB02/03059 




WO 02/092818 



232 



PCT/IB02/03059 




WO 02/092818 



233 



PCT/IB02/03059 



R g s 3 



IU3 



1 1 11 i j 



iV<< 



^ yj ~ ^ S 



111 £i 

< a) N a) <u i 

yi{!|Ii 

^ | ? <i 5 1 ^2 

Pi § 8" |S 



> o. uj cc: m en til 



?0 5 



5 $.8 v "i^a 



€ e 1 1 1 ? 

£ -a'E g 
is 



■a - 



CO 



b y ff =3 

Z 5 d 



"SO 



£5 ^ cr 

IIS 

I<1 




I5l 



8 S o 

"I 



WO 02/092818 



234 



PCT/IB02/03059 




WO 02/092818 



235 



PCT/IB02/03059 




WO 02/092818 



236 



PCT/IB02/03059 




WO 02/092818 



237 



PCT/IB02/03059 



Identities = 46/183 (25%), Positives = 81/183 (44%), Gaps = 
11/183 (6%) pir||F69065 hypothetical protein MTH1490 - 
Methanobacterium thermoautotrophicum (strain Delta H) 
gb|AAB85965.1| (AE000909) unknown [Methanobacterium 
thermoautotrophicum] Length = 188 


Identities = 121/199 (60%), Positives = 157/199 (78%), Gaps = 
3/199 (1%) emb|CAB54585.1| (AJ006400) response regulator 
[Streptococcus pneumoniae] Length = 199 


Identities = 109/221 (49%), Positives = 150/221 (67%), Gaps = 
9/221 (4%) gb|AAK02817.1| (AE006110) unknown [Pasteurella 
multocida] Length = 220 


Identities = 59/131 (45%), Positives = 86/131 (65%), Gaps = 
2/131 (1%) sp|P44638|LGUL_HAEIN LACTOYLGLUTATHIONE 
LYASE (METHYLGLYOXALASE) (ALDOKETOMUTASE) 
(GLYOXALASE I) (GLX I) (KETONE-ALDEHYDE MUTASE) 
(S-D-LACTOYLGLUTATHIONE METHYLGLYOXAL LYASE) 
pir||l64147 lactoylglutathione lyase (EC 4.4.1.5) - Haemophilus 
influenzae gb|AAC21986.1| (U32717) lactoylglutathione lyase 
(gloA) [Haemophilus influenzae Rd] Length = 135 


Identities = 139/308 (45%), Positives = 202/308 (65%), Gaps = 
3/308 (0%) sp|Q45539|CSBB_BACSU CSBB PROTEIN 
pir||JC5173 stress response protein csbB - Bacillus subtilis 
gb|AAB38429.1 1 (L77099) 44 identity over 302 residues with 
hypothetical protein from Synechocystis sp, accession 
D64006_CD; expression induced by environmental stress; 
some similarity to glycosyl transferases; two potential 

membrane-spanning helices [Bacillus subtil> 
emb|CAB12688.1| (Z99108) stress response protein [Bacillus 
subtilis] dbj|BAA24480.1| (D85082) YfhN [Bacillus subtilis] 
Length = 329 
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Identities = 126/258 (48%), Positives = 175/258 (66%), G; 
2/258 (0%) sp|066126|ISPA MICLU 
GERANYLTRANSTRANSFERASE (FARNESYL-DIPHOSF 
SYNTHASE) (FPP SYNTHASE) dbj|BAA25265 
(AB003187) farnesyl diphosphate synthase [Micrococcus I 
Length = 291 


Identities = 22/77 (28%), Positives = 41/77 (52%), Gaps = 
(5%) pir||G69865 hypothetical protein ykuJ - Bacillus sut 
emb|CAA1 0873.1 1 (AJ222587) YkuJ protein [Bacillus sut 
emb|CAB1 3283.1 1 (Z99111) ykuJ [Bacillus subtilis] L 
= 79 


















Identities = 215/439 (48%), Positives = 311/439 (69%), G; 
5/439 (1%) sp|P54475|YQFR BACSU PROBABLE Rl 
HELICASE IN CCCA-SODA INTERGENIC REGION pir||C 
ATP-dependent RNA helicase homolog yqfR - Bacillus si 
dbj|BAA12495.1| (D84432) YqfR [Bacillus subtilis] 
emb|CAB 14444.1 1 (Z99116) similar to ATP-dependent F 
helicase [Bacillus subtilis] Length = 438 








Identities = 24/75 (32%), Positives = 46/75 (61%) 
sp|032233|SECG_BACSU PROBABLE PROTEIN-EXP( 
MEMBRANE PROTEIN SECG pir||A70028 hypothetical p 
yvaL - Bacillus subtilis emb|CAB15368.1| (Z99121) yvaL [£ 
subtilis] Length = 76 
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Identities = 109/218 (50%), Positives = 146/218 (66%), Gaps = 

15/218 (6%) sp|P46338[YQGG BACSU PROBABLE ABC 
TRANSPORTER BINDING PROTEIN YQGG PRECURSOR 
pir||A69956 phosphate ABC transporter (binding protein) homoiog 
yqgG - Bacillus subtilis dbj|BAA09581.1| (D58414) 
ORF108 [Bacillus subtilis] dbj|BAA12510.1| (D84432) YqgG 
[Bacillus subtilis] emb|CAB14429.1| (Z99116) alternate gene 
name: yzmB~similar to phosphate ABC transporter 
(binding protein) [Bacillus subtilis] Length = 300 


Identities = 153/445 (34%), Positives = 250/445 (55%), Gaps = 
11/445 (2%) emb|CAB61253.1| (AJ250422) ORFC [Oenococcus 
oeni] Length = 463 




Identities = 303/417 (72%), Positives = 356/417 (84%), Gaps = 
1/417 (0%) sp|P96489]PROA_STRTR GAMMA-GLUTAMYL 

PHOSPHATE REDUCTASE (GPR) (GLUTAMATE-5- 
SEMIALDEHYDE DEHYDROGENASE) (GLUTAMYL- 
GAMMA-SEMIALDEHYDE DEHYDROGENASE) 
emb|CAA63148.1| (X92418) gamma-glutamyl phosphate 
reductase [Streptococcus thermophilus] Length = 
416 




Identities = 63/1 15 (54%), Positives = 83/115 (71%), Gaps = 
1/115 (0%) sp|O35046|YOCD BACSU HYPOTHETICAL 36.4 

KDA PROTEIN IN CSAA-DES INTERGENIC REGION 
pir||A69901 immunity to bacteriotoxins homoiog yocD - Bacillus 

subtilis gb|AAB84435.1| (AF027868) YocD [Bacillus subtilis] 
emb|CAB1 3809.1 1 (Z99114) similar to immunity to bacteriotoxins 
[Bacillus subtilis] Length = 325 
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Identities = 30/51 (58%), Positives = 32/51 (61%) pir||F71245 

hypothetical protein PHS004 - Pyrococcus horikoshii 
dbj|BAA29293.1| (AP000001) 58aa long hypothetical protein 
[Pyrococcus horikoshii] Length = 58 


Identities = 122/123 (99%), Positives = 123/123 (99%) 
gb|AAG09988.1|AF248037_3 (AF248037) cation efflux system 
protein [Streptococcus agalactiae] Length = 287 








Identities = 200/265 (75%), Positives = 235/265 (88%) 
sp|P96488|PROB_STRTR GLUTAMATE 5-KINASE (GAMMA- 
GLUTAMYL KINAS~E) (GK) emb|CAA63147.1| (X92418) gamma- 
i glutamyl kinase [Streptococcus thermophilus] Length = 267 


Identities = 19/36 (52%), Positives = 30/36 (82%) pir]|T50042 
hypothetical protein tasA [imported] - Streptococcus pneumoniae 
emb|CAA59773.1| (X85787) tasA [Streptococcus pneumoniae] 
Length = 359 






Identities = 30/71 (42%), Positives = 37/71 (51%), Gaps = 1/71 
| (1 %) pir||G72514 hypothetical protein APE2092 - Aeropyrum 
pernix (strain K1) dbj|BAA81 103.1 1 (AP000063) 101aa long 
hypothetical protein [Aeropyrum pernix] Length = 101 
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Identities = 21/61 (34%), Positives = 38/61 (61%), Gaps = 1/61 
(1%) ref|NP_076769.1| Orf18 [bacteriophage blL310] 
gb|AAK04132.1|AE006242_11 (AE006242) prophage ps1 protein 

10 [Lactococcus lactis subsp. lactis] 
gb|AAK08422.1|AF323671_18 (AF323671) Orf18 [bacteriophage 
blL310] Length = 93 


Identities = 22/56 (39%), Positives = 35/56 (62%), Gaps = 4/56 
(7%) sp|P36417|GBF_DICDI G-BOX BINDING FACTOR (GBF) 
pir||A53185 G-box-binding factor - slime mold (Dictyostelium 
discoideum) gb|AAA21021.1| (L29075) G-box binding factor 
[Dictyostelium discoideum] Length = 708 


Identities = 150/230 (65%), Positives = 194/230 (84%), Gaps = 
1/230 (0%) sp|P52281|GLPF STRPN GLYCEROL UPTAKE 
FACILITATOR PROTEIN pir||S67937 glycerol uptake facilitator 
GIpF - Streptococcus pneumoniae (strain P13) 
gb|AAA91618.1| (U12567) glycerol uptake facilitator 
[Streptococcus pneumoniae] Length = 233 


Identities = 94/304 (30%), Positives = 152/304 (49%), Gaps = 

32/304 (10%) gb|AAK04228.1|AE006251_4 (AE006251) 
HYPOTHETICAL PROTEIN [Lactococcus lactis subsp. lactis] 
Length = 304 




Identities = 52/66 (78%), Positives = 60/66 (90%) 
gb|AAK05941.1|AE006414_7 (AE006414) 50S ribosomal protein 
L35 [Lactococcus lactis subsp. lactis] Length = 66 


Identities = 112/169 (66%), Positives = 134/169 (79%) 
sp|O53084|IF3_LISMO TRANSLATION INITIATION FACTOR IF- 
3 emb|CAA68920.1| (Y07640) translation initiation factor, IF3 
[Listeria monocytogenes] Length = 171 


Identities = 464/608 (76%), Positives = 539/608 (88%) 
gb|AAC34740.1| (U94770) alpha-glycerophosphate oxidase 
[Streptococcus pneumoniae] Length = 608 
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Identities = 96/354 (27%), Positives = 161/354 (45%), Gaps = 
61/354 (17%) ref|NP 053238.1| pX02-84 [Bacillus anthracis] 
gb|AAF13688.1|AF188935_86 (AF188935) pX02-84 [Bacillus 
anthracis] Length = 490 


Identities = 629/1241 (50%), Positives = 825/1241 (65%), Gaps = 
75/1241 (6%) gb|AAG33958.1|AF217414_1 (AF217414) 
pullulanase [Streptococcus pneumoniae] Length = 1287 


Identities = 134/299 (44%), Positives = 197/299 (65%) 
dbj|BAB08178.1| (AB036768) exfoliative toxin A [Staphylococcus 
hyicus] Length = 306 




Identities = 139/311 (44%), Positives = 200/311 (63%), Gaps = 
21/311 (6%) sp|Q9KAC3|MIAA BACHD TRNA DELTA(2)- 
ISOPENTENYLPYROPHOSPHATE TRANSFERASE (IPP 
TRANSFERASE) (ISOPENTENYL-DIPHOSPHATE:TRNA 
ISOPENTENYLTRANSFERASE) (IPTASE) (IPPT) 

dbj|BAB06085.1| (AP001515) tRNA isopentenylpyrophosphate 
transferase [Bacillus halodurans] Length = 314 


Identities = 183/406 (45%), Positives = 255/406 (62%), Gaps = 
12/406 (2%) dbj|BAB06081.1| (AP001515) unknown conserved 
protein [Bacillus halodurans] Length = 418 




Identities = 156/309 (50%), Positives = 209/309 (67%), Gaps = 
5/309 (1%) sp|P54548|YQJK BACSU HYPOTHETICAL 34.0 
KDA PROTEIN IN GLNQ-ANSR INTERGENIC REGION 
pir||C69964 conserved hypothetical protein yqjK - Bacillus subtilis 
dbj|BAA12617.1| (D84432) YqjK [Bacillus subtilis] 
emb|CAB14316.1| (Z99116) similar to hypothetical proteins 
[Bacillus subtilis] Length = 307 
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Identities = 262/262 (100%), Positives = 262/262 (100%) 
pir||T44638 capsular polysaccharide biosynthesis protein cps\ 
[imported]- Streptococcus agalactiae emb|CAB36980.' 
(Y17218) CpsY protein [Streptococcus agalactiae] 
emb|CAB36982.2| (Y17241) CpsY protein [Streptococcus 
agalactiae] gb|AAD53064.1|AF163833_1 (AF1 63833) CpsY 
[Streptococcus agalactiae] Length = 307 




Identities = 212/347 (61%), Positives = 261/347 (75%), Gaps = 
3/347 (0%) emb|CAA04376.1 1 (AJ000883) purK [Lactococcus 
lactis] Length = 349 


Identities = 102/158 (64%), Positives = 129/158 (81%) 
emb|CAA04375.1| (AJ000883) purE [Lactococcus lactis] 
Length = 161 


Identities = 239/419 (57%), Positives = 300/419 (71%), Gaps > 
7/419 (1%)sp|Q9ZF44|PUR2 LACLA 
PHOSPHORIBOSYLAMINE-GLYCINE LIGASE (GARS) 
(GLYCINAMIDE RIBONUCLEOTIDE SYNTHETASE) 
(PHOSPHORIBOSYLGLYCINAMIDE SYNTHETASE) 
emb[CAA04374.1| (AJ000883) purD [Lactococcus lactis] 
Length = 412 


Identities = 66/258 (25%), Positives = 119/258 (45%), Gaps = 
9/258 (3%) sp|P26833|YNGB_CLOPE HYPOTHETICAL 31.2 
KDA PROTEIN IN NAGH 5 REGION (ORFB) pir||S43902 

hypothetical protein B - Clostridium perfringens gb|AAA23257. 

(M81878) unknown [Clostridium perfringens] Length = 2' 


Identities = 133/299 (44%), Positives = 188/299 (62%), Gaps : 

1/299 (0%) pir||S41858 hypothetical protein - 
Thermoanaerobacterium saccharolyticum Length = 32( 
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Identities = 257/339 (75%), Positives = 293/339 (85%), Gaps = 
4/339 (1%) gb|AAC16901.1| (AF016634) 
phosphoribosylformylglycinamide cyclo-ligase 
[Lactococcus lactis subsp. cremoris] Length = 340 


Identities = 343/470 (72%), Positives = 406/470 (85%), Gaps = 
6/470 (1%) pir||T51702 amidophosphoribosyltransferase (EC 
2.4.2.14) [imported] - Lactococcus lactis gb|AAD12627.1| 
(U64311) phosphoribosylpyrophosphate amidotransferase 
[Lactococcus lactis] Length = 506 




Identities = 39/137 (28%), Positives = 63/137 (45%), Gaps = 
7/137 (5%) prf||21 19294A YFW1 gene [Saccharomyces 
cerevisiae] Length = 605 


Identities = 198/746 (26%), Positives = 330/746 (43%), Gaps = 
103/746 (13%) emb|CAC12194.1| (AL445066) 
phosphoribosylformylglycinamidine synthase related 
protein [Thermoplasma acidophilum] Length = 759 


Identities = 183/235 (77%), Positives = 206/235 (86%) 
sp|Q07296|PUR7 STRPN 
PHOSPHORIBOSYLAMINOIMIDAZOLE- 
SUCCINOCARBOXAMIDE SYNTHASE (SAICAR 
SYNTHETASE) pir||A36941 
phosphoribosylaminoimidazolesuccinocarboxamide synthase (EC 
6.3.2.6) - Streptococcus pneumoniae gb|AAA03540.1| (L15190) 

SAICAR synthetase [Streptococcus pneumoniae] 
gb|AAA69512.1| (M36180) SAICAR synthetase [Streptococcus 
pneumoniae] Length = 235 


[ Identities = 560/755 (74%), Positives = 648/755 (85%), Gaps = 
: 12/755 (1%) gb|AAD01782.1| (AF023421) CIpE [Lactococcus 
i lactis] Length = 748 
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Identities = 27/90 (30%), Positives = 49/90 (54%), Gaps = 7/90 
(7%) pir||T35570 hypothetical protein SC6G4.19c SC6G4.19c - 
Streptomyces coelicolor emb|CAA20397.1| (AL031317) 
SC6G4.19c, unknown, len: 190 aa; contains Pro-Ser- r ich 
domain at N-terminus [Streptomyces coelicolor A3(2)] 
Length = 190 




Identities = 82/239 (34%), Positives = 125/239 (51%), Gaps = 

15/239 (6%) pir||T44434 3-oxoacyl-[acyl-carrier-protein] 
reductase (EC 1 . 1 . 1 . 1 00) [imported] - Moritella marina 
dbj|BAA85256.1| (AB021978) 3-oxoacyl-[acyl carrier protein] 
reductase homolog [Moritella marina] Length = 244 




Identities = 35/153 (22%), Positives = 64/153 (40%), Gaps = 
5/153 (3%) pir||T35964 hypothetical protein SC9C7.13c- 
Streptomyces coelicolor emb|CAA22725.1| (AL035161) 
hypothetical protein SC9C7.13c [Streptomyces coelicolor 
A3(2)] Length =179 


Identities = 30/138 (21%), Positives = 68/138 (48%) 
dbj|BAB05950.1| (AP001514) unknown conserved protein in 
others [Bacillus halodurans] Length = 482 


: Identities = 126/320 (39%), Positives = 180/320 (55%), Gaps = 
: 18/320 (5%) dbj|BAB05950.1| (AP001514) unknown conserved 
j protein in others [Bacillus halodurans] Length = 482 
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Identities = 60/197 (30%), Positives = 83/197 (41%), Gaps = 
12/197 (6%) sp|P17334|PTCC_ECOLI PTS SYSTEM, 
CELLOBIOSE-SPECIFIC IIC COMPONENT (EllC-CEL) 
(CELLOBIOSE-PERMEASE IIC COMPONENT) 
(PHOSPHOTRANSFERASE ENZYME II, C 
COMPONENT) pir||A64933 celB protein - Escherichia coli (strain 

K-12) gb|AAC74807.1| (AE000268) PEP-dependent 
phosphotransferase enzyme II for cellobiose, arbutin, and 
salicin [Escherichia coli K12] Length = 452 


Identities = 53/240 (22%), Positives = 102/240 (42%), Gaps = 
24/240 (10%) gb|AAD1 1512.1 1 (U60828) unknown [Lactococcus 
lactis] Length = 307 




Identities = 218/275 (79%), Positives = 246/275 (89%) 
sp|P21998|EXOA_STRPN EXODEOXYRIBONUCLEASE 
pir||A32301 exodeoxyribonuclease (EC 3.1.11.-) exoA- 
Streptococcus pneumoniae gb|AAA26879.1| (J04234) 
exodeoxyribonuclease [Streptococcus pneumoniae] Length 
= 275 


Identities = 56/107 (52%), Positives = 74/107 (68%), Gaps = 
1/107 (0%) dbj|BAB07204.1| (AP001518) arsenate reductase 
[Bacillus halodurans] Length = 119 


Identities = 75/156 (48%), Positives = 99/156 (63%), Gaps = 
9/156 (5%) pir||F82390 methylated-DNA--protein-cysteine S- 
methyltransferase (EC 2.1.1.63) VCA1017 [similarity] - 
Vibrio cholerae (group 01 strain N16961 ) gb|AAF9691 3.1 1 
(AE004427) methylated-DNA-protein-cysteine S- 
methyltransferase [Vibrio cholerae] Length = 157 
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Identities = 102/313 (32%), Positives = 168/313 (53%), Gaps = 
21/313 (6%) sp|Q58424|SERA_METJA D-3- 
PHOSPHOGLYCERATE DEHYDROGENASE (PGDH) 
pir||A64427 phosphoglycerate dehydrogenase (EC 1.1.1.95) - 
Methanococcus jannaschii gb|AAB99020.1| (U67544) 
phosphoglycerate dehydrogenase (serA) [Methanococcus 
jannaschii] Length = 524 


Identities = 45/170 (26%), Positives = 78/170 (45%), Gaps = 
13/170 (7%) pir||G81269 probable acetyltransferase Cj1715 
[imported] - Campylobacter jejuni (strain NCTC 1 1 168) 
emb|CAB73701.1| (AL1 39079) putative acetyltransferase 
[Campylobacter jejuni] Length = 1 76 


Identities = 169/363 (46%), Positives = 252/363 (68%), Gaps = 
8/363 (2%) gb|AAF1 3453.1 |AF204962_1 (AF204962) 
phosphoserine aminotransferase [Bacillus alcalophilus] 
Length = 361 


Identities = 80/203 (39%), Positives = 116/203 (56%), Gaps = 
7/203 (3%) ref|XP 00581 0.1 1 CGI-32 protein [Homo sapiens] 
Length = 307 




Identities = 141/287 (49%), Positives = 190/287 (66%), Gaps = 
2/287 (0%) dbj|BAB03768.1| (AP001507) unknown conserved 
protein [Bacillus halodurans] Length = 289 


Identities = 45/1 16 (38%), Positives = 62/1 16 (52%), Gaps = 
8/116 (6%) dbj|BAB03765.1| (AP001507) unknown conserved 
protein in B. subtilis [Bacillus halodurans] Length = 
116 


Identities = 82/219 (37%), Positives = 124/219 (56%), Gaps = 
3/219 (1%) dbj|BAB03763.1|(AP001507) DNA polymerase 111 
i delta subunit [Bacillus halodurans] Length = 328 
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Identities = 112/210 (53%), Positives = 148/210 (70%), Gaps = 
1/210 (0%) dbj|BAB03761.1| (AP001507) thymidylate kinase 
[Bacillus halodurans] Length = 210 


Identities = 73/166 (43%), Positives = 1 16/166 (68%), Gaps = 
2/166 (1%) pir||H72290 conserved hypothetical protein - 
Thermotoga maritima (strain MSB8) 
gb|AAD36216.1|AE001771_9 (AE001771) conserved hypothetical 
protein [Thermotoga maritima] Length = 215 


Identities = 135/233 (57%), Positives = 180/233 (76%) 
pir||T35757 probable branched chain amino acid transport ATP- 
binding protein - Streptomyces coelicoior 
emb|CAB52068.1| (AL109732) putative branched chain amino 
acid transport ATP-binding protein [Streptomyces 
coelicoior A3(2)] Length = 238 


Identities = 136/273 (49%), Positives = 190/273 (68%), Gaps = 
21/273 (7%) pir||F72290 branched chain amino acid ABC 

transporter, ATP-binding protein - Thermotoga maritima 
(strain MSB8) gb|AAD36214.1|AE001771_7 (AE001771) 
branched chain amino acid ABC transporter, ATP-binding 
protein [Thermotoga maritima] Length = 284 


Identities = 121/343 (35%), Positives = 195/343 (56%), Gaps = 
36/343 (10%) pir||E72290 branched chain amino acid ABC 
transporter, permease protein - Thermotoga maritima 
(strain MSB8) gb|AAD36213.1|AE001771_6 (AE001771) 
branched chain amino acid ABC transporter, permease 
| protein [Thermotoga maritima] Length = 359 










o 

CO 


| 

Contigl 34 (5283-5918 p) 


Contigl 34 (4535-5194 p) i 


Contigl 34 (3806-4516 p) 


Contigl 34 (3042-3806 p) 


Contigl 34 (2088-3041 p) 


SA-453.1 j 


SA-454.1 


SA-455.1 


SA-456.1 


SA-457.1 


SeqID 1827 


SeqID 1828 i 


SeqID 1829 


SeqID 1830 


SeqID 1831 



WO 02/092818 



273 



PCT/IB02/03059 




WO 02/092818 



274 



PCT/IB02/03059 




WO 02/092818 



275 



PCT/IB02/03059 




WO 02/092818 



276 



PCT/IB02/03059 




WO 02/092818 



277 



PCT/IB02/03059 




WO 02/092818 



278 



PCT/IB02/03059 



Identities = 256/443 (57%), Positives = 333/443 (74%), Gaps = 
4/443 (0%) sp|P44917|Y883_HAEIN HYPOTHETICAL PROTEIN 
HI0883 pir||H64099 probable amino acid transport protein 
HI0883, sodium-dependent - Haemophilus influenzae 
(strain Rd KW20) gb|AAC22541.1| (U32770) amino acid carrier 
protein, putative [Haemophilus influenzae Rd] 
Length = 456 


Identities = 118/282 (41%), Positives = 181/282 (63%) 
sp|P46348|YEAB BACSU HYPOTHETICAL 31.8 KD PROTEIN 
IN GABP-GUAA INTERGENIC REGION (ORFX) pir||B69791 
cation efflux system membrane protein homolog yeaB - Bacillus 

subtilis gb|AAB62307.1| (U51115) YeaB [Bacillus subtilis] 
emb|CAB12451.1| (Z99107) alternate gene name: ydxT~similar 
to cation efflux system membrane protein [Bacillus subtilis] 
Length = 290 


Identities = 34/1 10 (30%), Positives = 67/1 10 (60%), Gaps = 
1/110 (0%) pir||A71191 hypothetical protein PH1801 - Pyrococcus 
horikoshii dbj|BAA30920.1| (AP000007) 109aa long hypothetical 
protein [Pyrococcus horikoshii] Length = 109 


Identities = 80/226 (35%), Positives = 136/226 (59%), Gaps = 
1/226 (0%) pir||D69983 conserved hypothetical protein ysbB - 
Bacillus subtilis emb|CAA99613.1| (Z75208) hypothetical protein 
[Bacillus subtilis] emb|CAB14850.1| (Z99118) similar to 
hypothetical proteins [Bacillus subtilis] Length = 231 


Identities = 44/194 (22%), Positives = 90/194 (45%), Gaps = 
13/194 (6%) emb|CAA76857.1| (Y17797) hypothetical protein 
[Enterococcus faecalis] Length = 247 










co 




CO 




No Hits found 


No Hits found 


I No Hits found 


Contig135 (34376-35722 m) 


Contig135 (33077-34312 m) 


Contig135 (32526-32918 m) 


Contig135 (31850-32545 m) 


Contig135 (31153-31782 m) 


Contig135 (30605-30751 p) 


I Contig135 (30121-30657 m) 


I Contigl 35 (29390-29749 m) 


SeqlD 1873 '. SA-500.1 


SA-501.1 


SA-502.1 


SA-503.1 


j SA-504.1 


SA-505.1 


SA-506.1 


SA-507.1 


SeqlD 1874 


SeqlD 1875 


SeqlD 1876 


SeqlD 1877 


SeqlD 1878 


SeqlD 1879 


| SeqlD 1880 



WO 02/092818 



279 



PCT/IB02/03059 




WO 02/092818 



PCT/IB02/03059 



Q. 3 3 m 



' Q- 3 

5p<55 



nj CO TO CD to 00 £ 

ro 6 jo O O ra ^ 

3 <_ 3 <_ 359. 3< 

<u 3" CO <d3"W <l> 3"OT g | 

is S is q- J? js q- = is 



> |< § o< u q< » o s 

?f 

5l-€ £fcf 

;oa o I o ® og 

3 0< O < O < Ov 



~ 2 >• a '§ Ci 3 

2 o "S — -a — o) 
■* U. -S *- 3 t ^ 



.T= UJ ^- _Q ~ -LJ g) 

o m £ "° Sr | g 

•S- W q. w .£ 3 0) - 

00 O 3 ™ E 

c^*Z • Sol 

1 £ £ 

2 s. < E E co s 



PCT/IB02/03059 




WO 02/092818 PCT/IB02/03059 




WO 02/092818 



PCT/TB02/03059 



ih.I 


/o), Gaps = 
5in MTH413- 
-ain Delta H) 
stein 

ength = 130 


l%), Gaps = 
lacteroides 
itigen BspA 
181 


5%), Gaps = 
EIN ECSB 
;sB - Bacillus 
EcsB protein 
/pothetical 
)109) ABC 
Length = 


Identities = 475/727 (65%), Positives = 585/727 (80%), Gaps = 
19/727 (2%) sp|P78027|RIR1_MYCPN RIBONUCLEOSIDE- 
DIPHOSPHATE REDUCTASE ALPHA CHAIN 
(RIBONUCLEOTIDE REDUCTASE) pir||S73838 
ribonucleoside-diphosphate reductase (EC 1.17.4.1) large chain 
nrdE - Mycoplasma pneumoniae (strain ATCC 29342) 
gb|AAB96160.1| (AE000050) ribonucleoside-diphosphate 
reductase alpha chain~MPN324(new), 513(Himmelreich et 
a!., 1996) [Mycoplasma pneumoniae] Length = 721 


Identities = 39/149 (26%), Positives = 71/149 (47°/ 
4/149 (2%) pir||H83035-probable-transcription regul; 
[imported] - Pseudomonas aeruginosa (str, 
gb|AAG08263.1|AE004901_5 (AE004901) pre 
transcriptional regulator-[P-seudomonas ae 
Length = 270 


Identities = 42/130 (32%), Positives = 71/130 (541 
3/130 (2%) pir||G69153 conserved hypothetical prot< 
Methanobacterium thermoautotrophlcum (sti 
gb|AAB84919.1| (AE000825) conserved pre 
[Methanobacterium thermoautotrophicum] L 


Identities = 141/566 (24%), Positives = 242/566 (4' 
52/566 (9%) pir||T31094 surface antigen BspA - E 
forsythus gb|AAC82625.1| (AF054892) surface ar 
[Bacteroides forsythus] Length = 1C 


Identities = 102/413 (24%), Positives = 189/413 (4i 
76/413 (18%) sp|P55340|ECSB_BACSU PROTE 
pir||G69619 ABC transporter (membrane protein) ec 
subtilis emb|CAA61075.1| (X87807) hypothetical I 
[Bacillus subtilis] emb|CAA74408.1| (Y14077) H; 
protein [Bacillus subtilis] emb|CAB12845.1| (Z9S 
transporter (membrane protein) [Bacillus subtilis] 
408 
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Identities = 64/104 (61%), Positives = 82/104 (78%) 
sp|P55339|ECSA_BACSU ABC-TYPE TRANSPORTER ATP- 
BINDING PROTEIN ECSA pir||F69619 ABC transporter (ATP- 
binding protein) ecsA - Bacillus subtilis emb|CAA61074.1| 
(X87807rput"ative" ATP-binding protein of ABC-type [Bacillus 
subtilisl emb|CAA74409.1| (Y14077) Hypothetical protein 
[Bacillus subtilis] emb|CAB12844.1| (Z99109) ABC transporter 
(ATP-binding protein) [Bacillus subtilis] Length = 247 


Identities = 216/448 (48%), Positives = 297/448 (66%), Gaps = 
4/448 (0%) pir||F69806 RNA methyltransferase homolog yfjO - 
Bacillus subtilis emb|CAB12631.1| (Z99108) similar to RNA 
methyltransferase [Bacillus subtilis] dbj|BAA24300.1| (D78509) 
YfjO [Bacillus subtilis] Length = 466 


Identities = 73/263 (27%), Positives = 140/263 (52%), Gaps = 
9/263 (3%) dbj|BAB04643.1| (AP001510) unknown conserved 
protein in B. subtilis [Bacillus halodurans] Length = 
266 


Identities = 96/175 (54%), Positives = 122/175 (68%) 
dbj|BAB04659.1| (AP001510) unknown conserved protein in B. 
subtilis [Bacillus halodurans] Length = 175 


Identities = 142/331 (42%), Positives = 204/331 (60%), Gaps = 
2/331 (0%) gb|AAF61315.1| (U96166) unknown [Streptococcus 
cristatus] Length = 442 


Identities = 66/194 (34%), Positives = 98/194 (50%), Gaps = 
9/194 (4%) dbj|BAA94320.1 1 (AB033763) hypothetical protein 
[Staphylococcus aureus] Length = 255 
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Identities = 31/81 (38%), Positives = 43/81 (52%), Gaps = 18/81 
(22%) sp|P438-1-3|DNL-J-HAEIN DNA LIGASE 
(POLYDEOXYRIBONUCLEOTIDE SYNTHASE [NAD+]) 
pir||D64182 DNA ligase (NAD+) (EC 6.5.1 .2) - Haemophilus 
influenzae (strain Rd . KW20) gb|AAC22753.1| (U32789) 
DNA ligase (lig) [Haemophilus influenzae Rd] Length = 679 


Identities = 42/95 (44%), Positives = 56/95 (58%), Gaps = 4/95 
(4%) ref jXP_001 738. 1 1 megakaryocyte stimulating factor [Homo 
sapiens] Length = 1 385 


Identities = 114/279 (40%), Positives = 171/279 (60%), Gaps = 
3/279 (1%) sp|P28244|YDIB_ECOLI HYPOTHETICAL 31.2 KDA 
PROTEIN IN LPP-AROD INTERGENIC REGION pir||D64927 

probable shikimate 5-dehydrogenase (EC 1.1.1.25) ydiB - 
Escherichia coli dbj|BAA1 5449. 1 1 (D90811) Shikimate 5- 
dehydrogenase (EC 1.1.1.25). [Escherichia coli] 
gb|AAC74762.1| (AE000264) putative oxidoreductase 
[Escherichia coli K1 2] Length = 288 


Identities = 158/319 (49%), Positives = 214/319 (66%), Gaps = 
4/319 (1%) dbj|BAB05343.1| (AP001512) L-asparaginase 
[Bacillus halodurans] Length = 322 


Identities = 89/281 (31%), Positives = 141/281 (49%), Gaps = 
31/281 (11%) pir||C69862 conserved hypothetical protein ykrA - 
Bacillus subtilis emb|CAB1 3328.1 1 (Z991 11) similar to 
hypothetical proteins [Bacillus subtilis] gb|AAC24929.1| 
(AF012285) unknown [Bacillus subtilis] Length = 257 


Identities = 62/141 (43%), Positives = 93/141 (64%) 
dbj|BAB06903.1| (AP001518) BH3184~unknown conserved 
protein [Bacillus halodurans] Length = 147 
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Identities = 79/180 (43%), Positives = 116/180 (63%) 
~sp|P54456|YQEK_BACSU HYPOTHETICAL 21.3 KD PROT-EIN- 
IN AROD-COMER INTERGENIC REGION pir||G69951 
conserved hypothetical protein yqeK - Bacillus subtilis 

. dbj|BAA1 2448.1 1 (D84432) YqeK [Bacillus subtilis] 

emb|CAB14505.1| (Z99117) similar to hypothetical proteins 
[Bacillus subtilis] Length = 186 


Identities = 46/175 (26%), Positives = 81/175 (46%), Gaps = 
12/175 (6%) gb|AAG1 9496.1 1 (AE005041) Vng1100c 
[Halobacterium sp. NRC-1] Length = 183 


Identities = 80/214 (37%), Positives = 122/214 (56%), Gaps = 
3/214 (1%) gb|AAC95438.1| (AF068901) unknown 
[Streptococcus pneumoniae] Length = 234 


Identities = 220/398 (55%), Positives = 306/398 (76%), Gaps = 

3/398 (0%) gb|AAF36228.1|AF168363_4 (AF1 68363) 
oxalate:formate antiporter [Lactococcus lactis] Length = 
421 


Identities = 313/453 (69%), Positives = 375/453 (82%) 
gb|AAC95436.1| (AF068901) D-Ala-D-Ala adding enzyme 
[Streptococcus pneumoniae] Length = 457 


Identities = 243/346 (70%), Positives = 289/346 (83%) 
sp|054631|DDL STRPN D-ALAN I N E-D-ALAN I N E LIGASE (D- 
ALANYLALANINE SYNTHETASE) (D-ALA-D-ALA 
LIGASE) gb|AAC95435.1| (AF068901) D-Ala-D-Ala ligase 
[Streptococcus pneumoniae] Length = 347 


Identities = 181/198 (91%), Positives = 189/198 (95%) 
sp|P96053|RECR_STRTR RECOMBINATION PROTEIN RECR 
gb|AAC44615.1| (U58210) RecM [Streptococcus thermophilus] 
Length = 198 


Identities = 346/698 (49%), Positives = 482/698 (68%), Gaps = 
17/698 (2%) gb|AAC44614.1| (U58210) penicillin-binding protein 
2b [Streptococcus thermophilus] Length = 704 


lO 

m 








CD 




05 






E 


£ 


E 


E 


e" 


E 
o 


35947 m) 


E 










1 


j? 








25-1 


o 








4 




CO 








s 






1 


















CN 








Conl 


Cor 


Contig 


Contig 


Contig 


Contic 


Contic 


Contic 


















CO 




SA-6S 


SA-62 






! 


% 

CO 


CO 

< 

CO 


SA-6; 




< 

CO 


CO 


CO 








5 










CD 




§> 


o> 




1 












Q 


Q 


Q 


9 


q 


9 


9 


9 




Seq 


Seq 


Seq 


Seq 




Sec 


Sec 


Sec 



WO 02/092818 



296 



PCT/IB02/03059 




WO 02/092818 



297 



PCT/IB02/03059 



!! 

MS 

■ 

1 

ii 


Identities = 64/210 (30%), Positives = 95/210 (44%), Gaps = 
15/210 (7%) emb|CAA72266.1| (Y1 1477) endolysin 
(Bacteriophage Bastille] Length = 364 


Identities = 38/156 (24%), Positives = 83/156 (52%), Gaps = 
13/156 (8%) gb|AAG20117.1| (AE005090) NADH 
dehydrogenase/oxidoreductase-like protein; NolA 
[Halobacterium sp. NRC-1] Length = 303 


Identities = 61/164 (37%), Positives = 96/164 (58%), Gaps = 
13/164 (7%) sp|P36922|EBSC_ENTFA EBSC PROTEIN 
pir||C49939 ebsC protein - Enterococcus faecalis 
gb|AAC36853.1| (L23802) regulatory protein [Enterococcus 
faecalis] Length = 164 

Identities = 65/191 (34%), Positives = 93/191 (48%), Gaps = 
13/191 (6%) pir||G72260 phosphoglycerate mutase - Thermotoga 


| maritima (strain msbs) gb|AAU3b444.i|AbUUi/'yi_t> 
(AE001791) phosphoglycerate mutase [Thermotoga maritima] 
Length = 201 

Identities = 69/232 (29%), Positives = 108/232 (45%), Gaps = 
9/232 (3%) pirp69814 conserved hypothetical protein yfnB - 
Bacillus subtilis dbj|BAA20111.1| (D86418) YfnB [Bacillus 
subtilis] emb|CAB1 2552.1 1 (Z99107) similar to hypothetical 
I proteins [Bacillus subtilis] emb|CAB12562.1| (Z99108) similar to 
hypothetical proteins [Bacillus subtilis] Length = 235 
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Identities = 318/491 (64%), Positives = 391/491 (78%), Gaps = 

- -17491"(0%)-sp|P37477|SYK_BACSU LYSYL-TRNA 
SYNTHETASE (LYSINE-TRNA LIGASE) (LYSRS) pir||S66111 
lysine-tRNA ligase (EC 6.1.1.6) lysS - Bacillus subtilis 
dbj|BAA053-16^1| (D26185) lysyl-tRNA thynthetase [Bacillus 
subtilis] emb|CAB1 1858.1 1 (Z99104) lysyl-tRNA synthetase 
[Bacillus subtilis] Length = 499 


Identities = 103/151 (68%), Positives = 120/151 (79%) 
sp|P11998|RISB_BACSU 6,7-DIMETHYL-8-RIBITYLLUMAZINE 
SYNTHASE (DMRL SYNTHASE) (LUMAZINE 
SYNTHASE) (RIBOFLAVIN SYNTHASE BETA CHAIN) 
pir||A26708 riboflavin synthase (EC 2.5.1.9) complex beta chain 
ribH [validated] - Bacillus subtilis pdb|1RW|1 Chain 1, 
SynthaseRIBOFLAVIN SYNTHASE COMPLEX OF BACILLUS 

SUBTILIS pdb|1RW|2 Chain 2, SynthaseRIBOFLAVIN 
SYNTHASE COMPLEX OF BACILLUS SUBTILIS pdb|1RW|3 
Chain 3, SynthaseRIBOFLAVIN SYNTHASE COMPLEX OF 

BACILLUS SUBTILIS pdb|1RW|4 Chain 4, 
SynthaseRIBOFLAVIN SYNTHASE COMPLEX OF BACILLUS 

SUBTILIS pdb|1RW|A Chain A, SynthaseRIBOFLAVIN 
SYNTHASE COMPLEX OF BACILLUS SUBTILIS pdb|1RW|B 
Chain B, SynthaseRIBOFLAVIN SYNTHASE COMPLEX OF 

BACILLUS SUBTILIS pdb|1RW|C Chain C, 
SynthaseRIBOFLAVIN SYNTHASE COMPLEX OF BACILLUS 

SUBTILIS pdb|1RW|D Chain D, SynthaseRIBOFLAVIN 
SYNTHASE COMPLEX OF BACILLUS SUBTILIS pdb|1RW|E 
Chain E, SynthaseRIBOFLAVIN SYNTHASE COMPLEX OF 
BACILLUS SUBTILIS pdb|1RW|F Chain F, 

SynthaseRIBOFLAVIN SYNTHA! 
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identities = 215/465 (46%), Positives = 295/465 (63%), Gaps = 
7/465-(-1%)-dbj|BAB04424.1| (AP001509) uronate isomerase 
[Bacillus halodurans] Length = 472 


ldentities.H-92/_199_(-4.6%), Positives = 124/199 (62%), Gaps = 
6/199 (3%) pir||F72422 KHG-KDPG bifunctional aldolase TM0066 
[similarity] - Thermotoga maritima (strain MSB8) 
gb|AAD35160.1|AE001693_6 (AE001693) 2-dehydro-3- 
deoxyphosphogluconate aldolase/4-hydroxy-2- 
oxoglutarate aldolase [Thermotoga maritima] Length 


Identities = 67/225 (29%), Positives = 119/225 (52%), Gaps = 
17/225 (7%) sp|P42239|YCBG BACSU HYPOTHETICAL 
TRANSCRIPTIONAL REGULATOR IN GLTP-CWLJ 


iNlbKULNlu KttslUN (UKi-t)) pir||bby/».3 transcription 
regulator GntR family homolog ycbG - Bacillus subtilis 
dbj|BAA06471.1| (D30808) homologue of protein A which gene 
locates upstream pyruvate dehydrogenase gene cluster 

[Bacillus subtilis] emb|CAB12044.1| (Z99105) similar to 
transcriptional regulator (GntR family) [Bacillus subtilis] 
Length = 233 
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Identities = 255/599 (42%), Positives = 356/599 (58%), Gaps = 
25/599 (4%) gb|AAF65327.1| (AF234293) GUSA, hexaHis tagged 
[Binary vector pCAMBIA-1201] gb|AAF65330.1 1 (AF234294) 

GUSA, hexaHis tagged [Binary vector pCAMBIA-1281Z] 
gb|AAF65334.1| (AF234295) GUSAThexaHis tagged [Binary 
vector pCAMBIA-1291Z] gb|AAF65342.1| (AF234297) GUSA, 
hexaHis tagged [Binary vector pCAMBIA-1301] gb|AAF65372.1| 
(AF234306) GUSA, hexaHis tagged [Binary vector pCAMBIA- 
1381Z] gb|AAF65390.1| (AF234312) GUSA, hexaHis tagged 
[Binary vector pCAMBIA-1 391 Z] gb|AAF65397.1| (AF234314) 

GUSA, hexaHis tagged [Binary vector pCAMBIA-2201] 
gb|AAF65404.1| (AF234316) GUSA, hexaHis tagged [Binary 
vector pCAMBIA-2301] Length = 620 


Identities = 115/342 (33%), Positives = 179/342 (51%), Gaps = 
16/342 (4%) pir||G72422 2-keto-3-deoxygluconate kinase - 
Thermotoga maritima (strain MSB8) 
gb|AAD35161.1|AE001693_7 (AE001693) 2-keto-3- 
deoxygluconate kinase [Thermotoga maritima] Length = 
339 


Identities = 107/443 (24%), Positives = 180/443 (40%), Gaps = 
37/443 (8%) sp|P94488|YNAJ BACSU HYPOTHETICAL 
SYMPORTER IN GLNA-XYNB INTERGENIC REGION 
pir||A69888 H+-symporter homolog ynaJ - Bacillus subtilis 
gb|AAB41090.1| (U66480) YnaJ [Bacillus subtilis] 
emb|CAB13641.1| (Z991 13) similar to H+-symporter [Bacillus 
subtilis] Length = 463 


Identities = 165/329 (50%), Positives = 230/329 (69%), Gaps = 
1/329 (0%) gb|AAB1 7663.1 1 (U31 175) D-specific D-2-hydroxyacid 
dehydrogenase [Staphylococcus aureus] Length = 
330 


Identities = 100/305 (32%), Positives = 152/305 (49%), Gaps = 
31/305 (10%) dbj|BAB06434.1| (AP001516) two-component 
response regulator [Bacillus halodurans] Length = 312 
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Identities = 54/103 (52%), Positives = 70/103 (67%), Gaps = 
2/103 (1%) gb|AAG28337.1| (U88582) SatE [Streptococcus 
mutans] Length = 108 

Identities = 346/521 (66%), Positives = 411/521 (78%), Gaps = 
24/521 (4%)gb|AAD17886.1| (AF100456)_byaIuronate- 


associated protein precursor [Streptococcus equi] 
Length = 522 

Identities = 119/148 (80%), Positives = 136/148 (91%) 
gb|AAC17173.1| (AF065141) unknown [Streptococcus mutans] 


Identities = 188/218 (86%), Positives = 205/218 (93%) 
gb|AAC17173.1| (AF065141) unknown [Streptococcus mutans] 
Length = 356 

Identities = 96/320 (30%), Positives = 172/320 (53%), Gaps = 
16/320 (5%) sp|P42422|YXDK BACSU HYPOTHETICAL 
SENSOR-LIKE HISTIDINE KWASE IN IDH 3 REGION 


pir||H70073 two-component sensor nistiaine Kinase nomoiog 
yxdK - Bacillus subtilis dbj|BAA03301.1| (D14399) 
hypothetical protein [Bacillus subtilis] emb|CAB16001.1| 


(Z99124) similar to two-component sensor histidine kinase [YxdJ] 
[Bacillus subtilis] Length = 325 


Identities = 95/226 (42%), Positives = 136/226 (60%), Gaps = 
10/226 (4%) pir||D70032 two-component response regulator 
[YvcQ] homolog yvcP - Bacillus subtilis emb|CAB08062.1 1 


(Z94043) hypothetical protein [Bacillus subtilis] 
emb|CAB15477.1| (Z99121) similar to two-component response 
regulator [YvcQ] [Bacillus subtilis] Length = 237 


Identities = 154/666 (23%), Positives = 300/666 (44%), Gaps = 
40/666 (6%) gb|AAF99695.1|AF267498_5 (AF267498) permease 
OrfY [Streptococcus mutans] Length = 640 
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Identities = 926/927 (99%), Positives = 927/927 (99%) 
-sp|Q9ZF20|lF2_STRAG TRANSLATION INITIATION FACTOR - " 
IF-2 emb|CAA05919.1| (AJ003164) initiation factor IF2 
[Streptococcus agalactiae] emb|CAC00489.1| (AJ251495) 
-initiation factor 2 [Streptococcus agalactiae] emb|CAC0049-M |- 
(AJ251496) initiation factor 2 [Streptococcus agalactiae] 
Length = 927 


Identities = 122/122 (100%), Positives = 122/122 (100%) 
emb|CAA05920.1| (AJ003164) ribosome binding factor A 
[Streptococcus agalactiae] emb|CAC00486.1| (AJ251493) 

ribosome binding factor A [Streptococcus agalactiae] 
emb|CAC00488.1| (AJ251494) ribosome binding factor A 
[Streptococcus agalactiae] emb|CAC00490.1| (AJ251495) 

ribosome binding factor A [Streptococcus agalactiae] 
emb|CAC00492.1| (AJ251496) ribosome binding factor A 
[Streptococcus agalactiae] emb|CAC00498.1| (AJ251499) 
ribosome binding factor A [Streptococcus agalactiae] 
Length = 122 


Identities = 58/220 (26%), Positives = 90/220 (40%), Gaps = 
8/220 (3%) sp|Q01 1 09|BAH_STRHY ACETYL-HYDROLASE 
gb|AAA79277.1| (M64783) acetyl-hydrolase [Streptomyces 
| hygroscopicus] Length = 299 


Identities = 67/138 (48%), Positives = 99/138 (71%) 
gb|AAG10085.1|AF296446_1 (AF296446) CopY [Streptococcus 
mutans] Length = 147 


Identities = 440/740 (59%), Positives = 571/740 (76%), Gaps = 
1/740 (0%) gb|AAG10086.1|AF296446_2 (AF296446) CopA 
[Streptococcus mutans] Length = 742 


Identities = 31/67 (46%), Positives = 43/67 (63%) 
58 j gb|AAG1 0087.1 |AF296446_3 (AF296446) CopZ [Streptococcus 
mutans] Length = 67 
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Identities = 99/310 (31%), Positives = 172/310 (54%), Gaps = 

7/310 (2%) sp|Q58092|TKTC METJA PUTATIVE 

TRANSKETOLASE C-TERMINAL SECTION (TK) pir||G64384 
transketolase (EC 2.2.1.1) - Methanococcus jannaschii 
gb|AAB98674.1| (U67515) transketolase [Methanococcus — 
jannaschii] Length = 316 


Identities = 80/149 (53%), Positives = 105/149 (69%), Gaps = 
2/149 (1%) sp|P02417|RL9_BACST 50S RIBOSOMAL PROTEIN 
L9 (BL17) pir||R5BS7F ribosomal protein L9 - Bacillus 
stearothermophilus pdb|487D|K Chain K, Seven Ribosomal 
Proteins Fitted To A Cryo-Electron Microscopic Map Of 
The Large 50s Subunit At 7.5 Angstroms Resolution 
pdb|1DIV| Ribosomal Protein L9 Length = 149 


Identities = 111/438 (25%), Positives = 195/438 (44%), Gaps = 
51/438 (1 1%) pir||G83576 hypothetical protein PA0545 [imported] 
- Pseudomonas aeruginosa (strain PA01) 
gb|AAG03934.1|AE004491_1 (AE004491) hypothetical protein 
[Pseudomonas aeruginosa] Length = 434 


Identities = 55/89 (61%), Positives = 71/89 (78%) 
sp|P21473|RS15_BACSU 30S RIBOSOMAL PROTEIN S15 
(BS18) pir||F69700 ribosomal protein S15 (rpsO) - Bacillus 
subtilis emb|CAB02560.1| (Z80835) ribosomal protein S15 
[Bacillus subtilis] emb|CAB13541.1| (Z99112) ribosomal protein 
S1 5 (BS1 8) [Bacillus subtilis] Length = 89 
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Identities = 102/138 (73%), Positives = 121/138 (86%), Gaps = 
1/138 (0%) dbj|BAA23756.1| (AB009314) proton-translocating 
ATPase, epsiron subunit [Streptococcus bovis] 
Length = 138 


Identities = 248/423 (58%),_e.o.sj.tives = 323/423 (75%), Gaps = 

5/423 (1%) sp|P70965|MUA1_BACSU UDP-N- 
ACETYLGLUCOSAMINE 1-CARBOXYVINYLTRANSFERASE 1 
(ENOYLPYRUVATE TRANSFERASE) (UDP-N- 
ACETYLGLUCOSAMINE ENOLPYRUVYL 
TRANSFERASE) (EPT) pir||A69662 UDP-N-acetylglucosamine 1 
carboxyvinyltransferase murA - Bacillus subtilis 
emb|CAB03688.1| (Z81356) UDP-N-acetylglucosamine 1- 

carboxyvinyltransferase [Bacillus subtilis] 
emb|CAB15693.1| (Z99122) UDP-N-acetylglucosamine 1- 
carboxyvinyltransferase [Bacillus subtilis] Length = 
436 


Identities = 167/287 (58%), Positives = 200/287 (69%), Gaps = 
15/287 (5%) sp|Q03158|NUCE STRPN DNA-ENTRY 
NUCLEASE (COMPETENCE-SPECIFIC NUCLEASE) 
pir||S10641 endA protein - Streptococcus pneumoniae 
emb|CAA38134.1| (X54225) membrane nuclease [Streptococcus 
pneumoniae] Length = 274 


Identities = 211/341 (61%), Positives = 272/341 (78%), Gaps = 
2/341 (0%) sp|P17921|SYFA_BACSU PHENYLALANYL-TRNA 

SYNTHETASE ALPHA CHAIN (PHENYLALANINE-TRNA 
LIGASE ALPHA CHAIN) (PHERS) pir||YFBSA phenylalanine- 
tRNA ligase (EC 6. 1 . 1 .20) alpha chain - Bacillus subtilis 
emb|CAA99603.1| (Z75208) phenylalany-tRNA synthetase beta 
subunit [Bacillus subtilis] emb|CAB14824.1| (Z99118) 
phenylalanyl-tRNA synthetase (alpha subunit) [Bacillus 
subtilis] Length = 344 
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entities = 115/254 (45%), Positives = 172/254 (67%) 
545|YABD_BACSU PUTATIVE DEOXYRIBONUCLEASE 
pir||S66068 conserved hypothetical protein yabD - Bacillus 
is dbj|BAA05274.1| (D26185) unknown [Bacillus subtilis] 
)|CAB11815.1| (Z99104) similar to hypothetical proteins 
[Bacillus subtilis] Length = 255 


ities = 82/179 (45%), Positives = 117/179 (64%), Gaps = 
2%) sp|P37547|YABF BACSU HYPOTHETICAL 20.7 KD 
EIN IN METS-KSGA INTERGENIC REGION pir||S66070 
onserved hypothetical protein yabF - Bacillus subtilis 
bj|BAA05276.1| (D26185) unknown [Bacillus subtilis] 
:|CAB11817.1| (Z99104) similar to hypothetical proteins 
[Bacillus subtilis] Length = 1 86 


tities = 39/121 (32%), Positives = 60/121 (49%), Gaps = 
(9%) pir||A83524 hypothetical protein PA0959 [imported] - 

Pseudomonas aeruginosa (strain PA01) 
V304348.1|AE004530_1 (AE004530) hypothetical protein 

[Pseudomonas aeruginosa] Length = 209 
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. .Identities = 156/284 (54%), Positives = 215/284 (74%),.Gap.sj=L 
2/284 (0%) sp|P37468|KSGA BACSU DIMETHYLADENOSINE 
TRANSFERASE (S-ADENOSYLMETHIONINE-6-N , N - 
ADENOSYL(RRNA) DIMETHYLTRANSFERASE) (16S RRNA 
DIMETHYLASE) (HIGH LEVEL KASUGAMYCIN RESISTANCE 
PROTEIN KSGA) (KASUGAMYCIN 
DIMETHYLTRANSFERASE) pir||S66071 probable (adenine- 
N6,N6-)-dimethyltransferase (EC 2.1 .1 .-) ksgA - Bacillus 
subtilis dbj|BAA05277.1| (D26185) high level kasgamycin 
resistance [Bacillus subtilis] emb|CAB1 1818.1 1 (Z99104) 
dimethyladenosine transferase [Bacillus subtilis] Length = 
292 


Identities = 141/242 (58%), Positives = 188/242 (77%), Gaps = 
1/242 (0%) pir||E69742 ABC transporter (ATP-binding protein) 
homolog ybaE - Bacillus subtilis dbj|BAA10984.1| 
(D64126) unknown [Bacillus subtilis] emb|CAB11922.1| (Z99104) 
similar to ABC transporter (ATP-binding protein) [Bacillus 
subtilis] Length = 276 


Identities = 94/278 (33%), Positives = 147/278 (52%), Gaps = 
16/278 (5%) sp|P42313|YXJB BACSU HYPOTHETICAL 31.5 KD 
PROTEIN IN KATB 3 REGION pir||H70078 conserved 
hypothetical protein yxjB - Bacillus subtilis dbj|BAA11703.1| 
(D83026) homologous to SwissProt:YEBH_ECOLI hypothetical 
protein; hypothetical [Bacillus subtilis] emb|CAB15927.1| 
(Z99123) similar to hypothetical proteins [Bacillus subtilis] 
emb|CAB15937.1| (Z99124) similar to hypothetical proteins 
[Bacillus subtilis] Length = 282 
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Identities = 149/296.(50%.),. Positives = 204/296 (68%), Gaps = 
14/296 (4%) pir||A69879 conserved hypothetical protein yloQ - 

Bacillus subtilis emb!CAA74251.1| (Y13937) YloQ protein 
[Bacillus subtilis] _emb|CAB13451.1| (Z99112) similar to 

hypothetical proteins [Bacillus subtilis] Length = 298 


Identities = 112/211 (53%), Positives = 152/211 (71%) 
dbj|BAB06221.1| (AP001515) unknown conserved protein 
[Bacillus halodurans] Length = 216 


Identities = 75/220 (34%), Positives = 112/220 (50%), Gaps = 
18/220 (8%) pir||C69879 hypothetical protein yloS - Bacillus 
subtilis emb|CAA74253.1 1 (Y13937) YloS protein [Bacillus 
i subtilis] emb|CAB13453.1| (Z99112) yloS [Bacillus subtilis] 
! Length = 214 


Identities = 157/393 (39%), Positives = 238/393 (59%), Gaps = 
3/393 (0%) pir||D82810 conserved hypothetical protein XF0413 

[imported) - Xylella fastidiosa (strain 9a5c) 
gb|AAF83223.1|AE003892_8 (AE003892) conserved hypothetical 


Identities = 139/313 (44%), Positives = 196/313 (62%), Gaps = 
6/313 (1%) gb|AAC44803.1| (U21636) cmp-binding-factor 1 
[Staphylococcus aureus] Length = 313 

Identities = 142/270 (52%), Positives = 196/270 (72%), Gaps = 
1/270 (0%) emb|CAA1 0902.1 1 (AJ222642) purR [Lactococcus 

lactis] Length = 271 
Identities = 47/120 (39%), Positives = 69/120 (57%), Gaps = 
5/120 (4%) dbj|BAA1 1325.1| (D78257) ORF8 [Enterococcus 
faecalis] Length = 120 
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TABLEAU 2 . Proteines de surface de Streptococcus agalactiae 





SEQ ID 


N° IPF 


Motif 
LPXTG 


% identite/ similitude 


1 


886 


18 


LPHTG 


24/37 : Sec (Surface exclusion proteine,) E.faecalis 


2 


386 


1250 


LPSTG 


22i '40 :Sec 10 (Surface exclusion proteine) 
Enter ococcus faecalis plasmid pCFlO 


3 


1669 


280 


LPKTG 


50/65 : pullulanase S. pneumoniae 


4 


1895 


523 


LPATG 


90/91 : alpha like proteine S. agalactiae 


5 


806 


1716 


LPSTG 


31/46 : M-like proteine 5. equi 


6 


1183 


2140 


LPLTG 


36/60 : cell-division protein homolog ywcF B. subtilis 
34/56 : stage V sporulation protein E B. halodurans 


7 


1346 


2337 


LPKTG 


25/38 : Unknown B. halodurans 


8 


1942 


571 


LPSTG 


50/60 : Hemagglutinine S. gordonii 


9 


2129 


765 


LPNTG 


28/43 : sdrc S. aureus 


10 


2046 


678 


LPKTG 


57/70 : putative cyclo-nucleotide phosphodiesterase 
Strep, dysgalactiae susp. equismilis 


11 


618 ' 


1503 


LPKTG 


49/65 : celle envelope proteinase S. thermophilus 


12 


1227 • 


220 


LPSTG 


30/43 : SspB (adhesion) S. gordonii 


13 


1954 : 


584 


LPKTG 


26/48 : hypothetical serine riche repeat prot S. pombe 


14 


1493 . 


2495 


LPKTG 


23/47 : gene drosophile 


15 


1955 


585 


LPKTG 


30/46 : 6-aminohexanoate-cyclic-dimer hydrolase 
Deinococcus radiodurans . 


16 


943 


1861 


LPKTG 


50/62 : hypothetical protein 2 S. mutans 


17 


1221 


2192 


LPKTG 


35/48 : C. elegans UNC-89 (6642 aa) 


18 


613 


15 


LPSTG 


37/52 : SpaA : Ag de surface de S. sobrinus 


19 


382 


1247 


LPSTG 


38/52 : SpaA : Ag de surface de S. sobrinus 


20 


792 


17 


LPKTG 


30 /47 : hypothetical proteine iota de S. pyogenes 
plasmid pDB 101 


21 


383 


1248 


LPRTG 


38/52 : hypothetical proteine iota de S. pyogenes 
plasmid pDBlOl 


22 


1418 


2414 


LPSTG 


33/47 : orfC E. faecalis, plasmid pAM-beta-1 


Autres proteines possibles (IPXTG, FPXTG) 


23 


2171 


807 


IPQTG 


31/43 : Inconnue B. Halodurans 
29/41 : fimbrial SU Actinomyces naeslundii 
24 :41 : putative cell-surface adhesin SdrF 
[Staphylococcus epidermidis] 


24 ' 


1343 


2334 


IPQTG 


27/38 : hypothetical protein 2 L. leichmanii 
23/38 : fimbrial SU Actinomyces naeslundii 


25 


659 


1551 


FPKTG 


37/50 : fibronectin binding protein I S. pyogenes 
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Similar to two-component sensor histidine kinase I 


Similar to riboflavin specific deaminase 
(diaminohydroxyphosphoribosylaminopyrimidine deaminase/5- 
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TABLEAU 4 . Localisation des 139 contigs de sequence SEQ ID No. 1 a SEQ ID No. 
139 sur la sequence genomique complete (SEQ ID No. 2345). 







Position sur genome 
complet (= SEQ ID n°2345) 


Sens 


SEQ ID 


Contig 


position Debut 


position Fin 


(m=minus / 
p=plus) 


SEQIDn°1 


Contigl 


1356648 


1355991 


m 


SEQ ID n°2 


Contig2 


341651 


341120 


m 


SEQ ID n°3 


Contig3 


476798 


476418 


m 


SEQ ID n°4 


Contig4 


1475712 


1475086 


m 


SEQ ID n°5 


Contig5 


784818 


784243 


m 


SEQ ID n°6 


Contig6 


1756826 


1757251 


P 


SEQ ID n°7 


Contig7 


1950108 


1949648 


m 


SEQ ID n°8 


Contig8 


138225 


138876 


P 


SEQ ID n°9 


Contig9 


2097891 


2098283 


P 


SEQ IDn°10 


Contigl 0 


1238491 


1237984 


m 


SEQIDn°11 


Contigl 1 


1882130 


1881745 


m 


SEQIDn°12 


Contigl 2 


1089348 


1088935 


m 


SEQIDn°13 


Contigl 3 


555788 


555189 


m 


SEQIDn°14 


Contig 14 


2017928 


2017437 


m 


SEQIDn°15 


Contig 15 


1154094 


1154701 


P 


SEQ IDn°16 


Contigl 6 


752647 


753091 


P 


SEQ IDn°17 


Contigl 7 


1355561 


1355078 


m 


SEQ IDn°18 


Contigl 8 


1255951 


1256101 


P 


SEQ IDn°19 


Contigl 9 


792712 


793148 


P 


SEQIDn°20 


Contig20 


481787 


482228 


P 


SEQ ID n°22 


Contig22 


1590263 


1590842 


P 


SEQ ID n°23 


Contig23 


508269 


508918 


P 


SEQ ID n°24 


Contig24 


1142198 


1 142488 


P 


SEQ ID n°25 


Contig25 


1982019 


1981737 


m 


SEQ ID n°26 


Contig26 


119342 


119919 


P 


SEQ ID n°28 


Contig28 


1124069 


1123256 


m 


SEQ ID n°29 


Contig29 


266586 


266900 


P 


SEQ ID n°30 


Contig30 


111013 


111623 


P 


SEQ ID n°31 


Contig31 


1804173 


1804706 


P 


SEQ ID n°32 


Contig32 


2170341 


2169828 


m 


SEQ ID n°33 


Contig33 


1959867 


1959394 


m 


SEQ ID n°34 


Contig34 


1295529 


1294939 


m 


SEQ ID n°35 


Contig35 


178592 


178071 


m 


SEQ ID n°36 


Contig36 


1857103 


1856614 


m 


SEQ ID n°37 


Contig37 


1063484 


1063911 


P 


SEQ ID n°38 


Contig38 


198025 


197570 


m 


SEQ ID n°39 


Contig39 


1486076 


1486553 


P 


SEQ ID n°40 


Contig40 


2033914 


2034352 


P 


SEQ ID n°41 


Contig41 


737932 


738486 


P 


SEQ ID n°42 


Contig42 


729008 


728453 


m 


SEQ ID n°43 


Contig43 


1671733 


1672151 


P 
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SEQ ID n°44 


Contig44 


1103091 


1103644 


P 


SEQ ID n°45 


Contig45 


7001 39 


699583 


m 


SEQ ID n°46 


Contiq46 


207521 


206897 


m 


SEQ ID n°47 


Contig47 


1064808 


1065099 


■ 


SEQ ID n°48 


Contig48 


1091636 


1092281 


p 


SEQ ID n°49 


Contig49 


1701764 


1700906 


m 


SEQ ID n°50 


Contig50 


609072 


609590 




SEQ ID n°51 


Contig51 


1459271 


1458780 


m 


SEQ ID n°52 


Contig52 


60603 


60154 


m 


SEQ ID n°53 


Contig53 


289646 


289284 


m 


SEQ ID n°54 


Contig54 


1536438 


1536058 


m 


SEQ ID n°55 


Contig55 


509420 


510430 


P 


SEQ ID n°56 


Contig56 


1559964 


1558709 




SEQ ID n°58 


Contig58 


2166712 


2165923 


m 


SEQ ID n°59 


Contig59 


1919605 


1920984 




P 


SEQ ID n°60 


Contig60 


962333 


960438 




SEQ ID n°61 


Contig61 


1363649 


1365724 


P 


SEQ ID n°62 


Contig62 


1 140306 


1137284 




SEQ ID n°63 


Contig63 


1702242 


1706039 


" 


SEQ ID n°64 


Contiq64 


1490271 


1493283 


P 


SEQ ID n°65 


Contig65 


783206 




P 


SEQ ID n°66 


Contig66 


852318 


— 849615 




SEQ ID n°67 


Contig67 


1882303 


1880181 




SEQ ID n°68 


Contig68 


1614050 


1618058 


P 


SEQ ID n°69 


Contig69 


1484885 


1490042 


P 


SEQ ID n°70 


Contig70 


510495 


516449 


^ 


SEQ ID n°71 


Contig71 


125082 


121213 




SEQ ID n°72 


Contig72 


1 557644 


1551892 


m 


SEQ ID n°73 


Contig73 


145707 


143269 


m 


SEQ ID n°74 


Contig74 


859105 


852465 


m 


SEQ ID n°75 


Contig75 


1219383 


1215342 


m 


SEQ ID n°76 


Contig76 


1091627 


1086724 


m 


SEQ ID n°77 


Contig77 


1245975 


1251984 




SEQ ID n°78 


Contig78 


1 1 5260 


121688 


D 


SEQ ID n°79 


Contig79 


1 100300 


1092624 


m 


SEQ ID n°80 


Contiq80 


1107948 


1100525 


- 


SEQ ID n°81 


Contig81 


1245466 


1237461 


m 


SEQ ID n°82 


Contig82 


2111296 


2104033 


m 


SEQ ID n°83 


Contig83 


33479 


27132 


m 


SEQ ID n°84 


Contig84 


1339614 


1350526 


p 


SEQ ID n°85 


Contig85 


2070423 


2058143 


m 


SEQ ID n°86 


Contig86 


1462530 


1470059 


P 


SEQ ID n°87 


Contig87 


526582 


517432 


m 


SEQ ID n°88 


Contig88 


1484487 


1470171 


m 


SEQ ID n°89 


Contig89 


1124087 


1136746 


P 


SEQ ID n°90 


Contig90 


1879890 


1866931 


m 


SEQ ID n°91 


Contig91 


1721684 


1706045 


m 


SEQ ID n°92 


Contig92 


1358184 


1357897 


m 


SEQ ID n°93 


Contig93 


1577596 


1560798 


m 


SEQ ID n°94 


Contig94 


115130 


103188 


m 
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SEQ ID n°95 


Contig95 


1921051 


1933881 


p 


SEQ ID n°96 


Contig96 


1944905 


1933782 




SEQ ID n°97 


Contig97 


1919624 


1906953 


m 


SEQ ID n°98 


Contig98 


2090559 


2103658 


p 


SEQ ID n°99 


Contig99 


1237482 


1219423 




SEQ IDn°100 


ContiglOO 


1123110 


1108191 


m 


SEQ IDn°101 


Contig101 


1551836 


1529458 


m 


SEQ IDn°102 


Contig102 


1818811 


1800978 




SEQ ID n°103 


Contig103 


764781 


783195 


p 


SEQ IDn°104 


Contig104 


1086606 


1065938 


m 


SEQ IDn°105 


Contig105 


125425 


143102 


p 


SEQ IDn°106 


Contig106 


962438 


984387 


p 


SEQ IDn°107 


Contig107 


1169838 


1190193 


p 


SEQ IDn°108 


Contiq108 


2090426 


2070667 


m 


SEQ IDn°109 


Contig109 


1140315 


1169462 


p 


SEQ ID n°111 


Contig111 


238297 


258413 


p 


SEQ ID n°112 


Contig112 


216686 


237881 


p 


SEQ ID n°113 


Contig113 


2209521 


16967 




SEQ IDn°114 


Contigl 14 


1883537 


1906918 


p 


SEQ ID n°115 


Contig115 


145772 


172009 


p 


SEQ ID n°116 


Contigl 16 


508181 


477405 




SEQ ID n°117 


Contigl 17 


859233 


888273 


p 


SEQ ID n°118 


Contigl 18 


1529046 


1494213 




SEQ ID n°119 


Contigl 19 


473132 


438871 


m 


SEQ ID n°120 


Contigl 20 


1981657 


1945366 


m 


SEQ ID n°121 


Contigl 21 


1613824 


1577594 


m 


SEQ ID n°122 


Contigl 22 


1765846 


1800817 


p 


SEQ IDn°123 


Contigl 23 


2111499 


2153851 


p 


SEQ IDn°124 


Contigl 24 


1721668 


1765765 


p 


SEQ ID n°125 


Contigl 25 


984406 


1025178 


p 


SEQ ID n°126 


Contigl 26 


1293488 


1339586 


p 


SEQ ID n°127 


Contigl 27 


216691 


176332 


m 


SEQIDn°128 


Contigl 28 


1818941 


1866861 


p 


SEQIDn°129 


Contigl 29 


849565 


785796 


m 


SEQ IDn°130 


Contigl 30 


888292 


960270 


p 


SEQIDn°131 


Contigl 31 


2208563 


2155215 


m 


SEQ IDn°132 


Contigl 32 


33590 


88257 


P 


SEQIDn°133 


Contigl 33 


1982609 


2057812 


P 


SEQIDn°134 


Contigl 34 


1700642 


1618142 


m 


SEQIDn°135 


Contigl 35 


1293063 


1190375 


m 


SEQIDn°136 


Contigl 36 


1366980 


1462324 


P 


SEQ ID n°137 


Contigl 37 


390853 


434186 


P 


SEQ ID n°138 


Contigl 38 


357393 


259739 


m 


SEQ ID n°139 


Contigl 39 


527049 


716899 


P 
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TABLEAU 5 . Propriete d'adherence a des cellules epitheliales humaines en culture de la 
souche NEM3 1 6 de S. agalactiae et de souches mutantes derivees. 



Souche 


Gene inactive 


% d'adhesion 3 






Cellules A549 


Cellules Hela 


NEM316 


aucun 


9 


16 


NEM1979 


IPF N° 1268 (srtA) 


1,5 


2 


NEM2056 


IPFN° 678 


2 


n.t. 


NEM2057 


IPFN° 1503 


4,5 


n.t. 



5 a , le pourcentage d'adhesion correspond au nombre de bacteries (Unite Formant des 
Colonies, UFC) restant adherentes aux cellules apres lavage avec du tampon PBS par 
rapport au nombre d'UFC ajoutees a la monocouche de cellules epitheliales. 
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o 

X 
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PspC (S. pneumoniae) 
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No homology in public databases 


Cell surface protein (S. mutans) 
CbpD (S. pneumoniae) 
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o 
&o 
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No homology in public databases 


No homology in public databases 
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leichmannii) 
Fimbrial structural subunit (Actinomyces 
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TABLEAU 7 . Distribution des genes codant pour des proteines de surface a motif 
LPXTG parmi des isolats cliniques independants de 5 serotypes de£ agalactiae. 



Seq ID 

(ADN) 


N° d'IPF 


Proportion des souches portant le gene 


Type la 
23 isolats 


Type lb 
7 isolats 


Type II 
12 isolats 


Type III 
39 isolats 


Type V 

16 
isolats 


non 
groupe 
2 isolats 


Frequence 

totale 
99 isolats 


4926 


1503 


100 


100 


100 


100 


100 


100 


100 


6331 


678 


100 


100 


100 


100 


100 


100 


100 


5491 


2192 


100 


100 


100 


100 


100 


100 


100 


5234 


1861 


100 


100 


100 


100 


100 


100 


100 


6246 


584 


100 


100 


100 


100 


100 


100 


100 


5842 


280 


100 


100 


100 


100 


100 


100 


100 


6247 


585 


86,9 


85,7 


91,7 


92,3 


81,3 


100 


88,9 


4965 


1551 


34,8 


85,7 


100 


94,8 


93,8 


100 


80,8 


6447 


807 


26,1 


85,7 


83,3 


92,3 


93,8 


100 


79,8 


5610 


2337 


86,9 


100 


100 


56,4 


100 


50 


78,8 


6236 


571 


82,6 


100 


83,3 


46,1 


100 


50 


71,7 


5103 


1716 


91,0 


100 


83,3 


38,5 


81,3 


50 


67,7 


5607 


2334 


56,5 


100 


83,3 


46,1 


100 


50 


65,6 


6411 


765 


30,4 


71,4 


41,7 


61,5 


87,5 


100 


57,6 


4921 


15 


65,2 


0 


41,7 


59 


12,5 


50 


46,5 


5090 


17 


4,3 


14,3 


16,7 


20,5 


6,3 


0 


13,1 


5180 


18 


4,3 


14,3 


0 


20,5 


6,3 


0 


11,1 


4706 


1248 


0 


0 


0 


12,8 


6,3 


0 


6 


5497 


220 


0 


14,3 


8,3 


5,1 


0 


0 


4,5 


4708 


1250 


0 


14,3 


0 


5,1 


0 


0 


3 


5677 


2414 


0 


0 


0 


7,7 


0 


0 


3 
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TABLEAU 8 . Lipoproteines 



Seq ID 

(ADN) 




Annotation 


6527 


9 


unknown 


6030 


339 


similar to unknown proteins 


6035 


344 


Similar to ABC transporter (binding protein) 


6137 


460 


Similar to ABC transporter (binding protein) 


6178 


504 


similar to unknown proteins 


6294 


638 


Similar to unknown proteins 


6335 


682 


Similar to adhesion proteins 


6377 


729 


similar to oligopeptide and pheromone binding protein 


6386 


739 


similar to other lipoprotein 


4495 


1018 


Similar to (oligopeptide) ABC transporter (binding protein) 


4596 


1119 


similar to ribose ABC transporter (binding protein) 


4636 


1162 


similar to (amino acid ?) ABC transporter (binding protein) 


4730 


1280 


similar to ABC transporter (binding protein) 


4816 


1377 


Similar to nickel ABC transporter (binding protein) 


4836 


1399 


similar to phosphate ABC transporter (binding protein) 


4906 


1481 


Similar to D,D-carboxypeptidase 


4920 


1499 


similar to peptidyl-prolyl cis-trans isomerase 


4925 


1502 


similar to metal ABC transporter (binding protein) 


4963 


1547 


Unknown 


5021 


1617 


Similar to unknown lipoprotein 


5158 


1775 


similar to ferrichrome ABC transporter (binding protein) 


5247 


1879 


similar to oligopeptide ABC transporter (binding protein) 


5306 


1955 


similar to glycine betaine/carnitine/choline ABC transporter (osmoprotectant- 
binding protein) 


5417 


2099 


similar to putative ABC transporter (binding protein) 


5423 


2103 


Unknwon, similar to unknown protein and to B. subtilis SpoIIIJ protein 


5450 


2133 


laminin-binding surface protein 


5486 


2185 


putative ABC transporter (binding protein) 
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5559 


2278 


putative ABC transporter (binding protein) 


5591 


2314 


similar to protease maturation protein 


5677 


2414 


Similar to plasmid related proteins, Putative peptidoglycan bound protein 
(LPXTG motif) 


5718 


2464 


Similar to unknown proteins 


5732 


2482 


similar to ferrichrome ABC transporter (binding protein) 


5799 


2597 


similar to amino acid ABC transporter (binding protein) 


5800 


2598 


similar to phosphate ABC transporter (binding protein) 


5837 


2789 


Unknown 


5861 


2843 


Similar to amino acid ABC transporter (binding protein) 


5883 


2875 


Unknown 


5923 


2922 


Similar to amino acid ABC transporter (binding protein) 



Les genes codant pour des lipoproteines ont ete identifies sur la base de la 
prediction du motif de coupure / modification de type lipoproteine [S. Hayashi, H. C. 
Wu. J Bioenerg Biomembr. 22, 451 (1990)] et d'un peptide signal (identifie en utilisant 
5 SignalP vs2.0 [H Nielsen, Prot Engin 12, 13-9. (1999)]) et par l'analyse des resultats de 
comparaison sur les banques de sequence proteiques en utilisant BLAST [S. F. Altschul 
et al., Nucleic Acids Res 25, 3389-402. (1997)]. 



Tableau 9 . Autres proteines de surface 

10 



Seq ID 

(ADN) 


N° d'IPF 


Annotation 


6037 


347 


group B streptococcal surface immunogenic protein 


4972 


1562 


Putative cell wall protein, weakly similar to peptidase or esterase 


6569 


948 


similar to fibronectin-binding protein 


5234 


1861 


similar to cell wall proteins 


5530 


2238 


possible surface protein 


5223 


1847 


CAMP factor 
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Ces proteines ont ete identifiees sur la base de similarity avec d'autres proteines 
de surface bacterienne et la prediction d'un peptide signal et ne faisant pas partie des 
classes des proteines ancrees au peptidoglycane et lipoproteines. 



5 TABLEAU 10 . Proteines impliquees dans la biosynthese de composes 
polysaccharidiques de la paroi de S. agalactiae. 



Seq ID 

(ADN) 




Annotation 


Commentaires 


4861 


1430 


similar to Streptococcus mutans RgpG protein required for 
biosynthesis of rhamnose-glucose polysaccharide 




6214 


544 


similar to rhamnosyltransferase 




6061 


381 


Unnown, Similar to UDP-N-acetylmuramoylalanine~D- 
glutamate ligase 




6517 


890 


similar to Cell Wall Muropeptide Branching Enzyme 




6518 


891 


similar to cell wall muropeptide branching enzyme 




6519 


892 


similar to cell wall muropeptide branching enzyme 




4743 


1295 


similar to glycosyltransferases 




6343 


692 


similar to hexosyltransferase 




6342 


691 


similar to glucosyl transferase 




5326 


1977 


Similar to UDP-D-glucose:galactosyl glucosyltransferase 




4952 


1532 


similar to N-acetylneuraminic acid synthetase 


Biosynthese de 
la capsule 


5619 


2346 


capsular polysaccharide biosynthesis protein 


5618 


2345 


similar to glycosyl transferase 


5617 


2344 


similar to glycosyl transferase 


5616 


2343 


capsular polysaccharide repeating-unit polymerase 


5615 


2342 


beta- 1 ,4-galactosyltransferase 


5614 


2341 


beta- 1 ,4-galactosyltransferase enhancer 


5613 


2340 


similar to glucose- 1 -phosphate transferase 


5611 


2339 


capsular polysaccharide chain length regulator/exporter 


5696 


2437 


putative chain length regulator CpsC 




5971 


301 


similar to dTDP-glucose-4,6-dehydratase 




5233 


1860 


similar to to Cell Wall Muropeptide Branching Enzyme 





WO 02/092818 



423 



PCT/IB02/03059 



5602 


2329 


similar to capsular polyglutamate biosynthesis 




5156 


1773 


Similar to UDP-N-acetylmuramoylalanyl-D-glutamyl-2, 6- 
diaminopimelate ligase 




5574 


2297 


Similar to putative hexosyl transferase 




5573 


2296 


Similar to rhamnosyl transferase 1 




5654 


2386 


Similar to capsular polysaccharide synthesis protein 




5656 


2388 


Similar to putative rhamnosyltransferase 




5526 


2233 


Similar to putative rhamnosyltransferase 




5527 


2235 


Similar to nucleotide-sugar dehydratase 




5529 


2237 


Similar to Pneumococcal LicD2 protein involved in 
phosphorylcholine metabolism 




5534 


2241 


similar to rhamnosyltransferase 




5625 


2354 


similar to putative rhamnosyltransferase 




5626 


2355 


dTDP-L-rhamnose synthase 




6223 


555 


Similar to putative glucosyl transferase 




6229 


562 


Similar to hypothetical glycosyl transferase 




6230 


563 


Similar to putative glycosyltransferase 




6231 


565 


Similar to putative glycosyl transferase 




6232 


566 


Similar to putative glycosyl transferase 




6233 


567 


Similar to putative glycosyl transferase 




5764 


2518 


similar to putative sugar transferase 




6095 


416 


similar to UDP-N-acetylglucosamine pyrophosphorylase 




5089 


1699 


Similar to UDP-N-acetylmuramate-alanine ligase 




5466 


2158 


similar to glycosyl transferase 




5465 


2157 


similar to glycosyl transferase 





Ces genes ont ete identifies par I'analyse des resultats de similarite avec les 
sequences proteiques connues en utilisant le logiciel BLASTP. Les produits de ces 
genes pourraient intervenir dans la biosynthese de polysaccharides qui pourraient etre 
5 des constituants de preparations vaccinales. 



WO 02/092818 PCT/IB02/03059 



REFERENCES 

I. Altschul, S. F, T- L. Madden, A. A. Schaffer, J. Zhang, Z. Zhang, W. Miller, 
and D. J. Lipman, 1997, Gapped BLAST and PSI-BLAST: a new generation of protein 
database search programs, [Review] [90 refs] Nucleic Acids Research, 25:3389-402. 

5 2. Birnboim, H. C, 1 983, A rapid alkaline extraction method for the isolation of 

plasmid DNA, Methods Enzymol., 100:243-255. 

3. Brodeur, B.B., M. Boyer, I. Charlebois, J. Hamel, F. Couture, C.R. Rioux, and 
D. Martin, 2000, Identification of Group B Strptococcal Sip Protein, which elicits cross- 
protective immunity, Infect. Immun., 68:5610-5618. 
10 4. Buchrieser, C, C. Rusniok, L. Frangeul, E. Couve\ A. Billault, F. Kunst, E. 

Carniel, and P. Glaser, 1999, The 102 kb locus of Yersinia pestis : sequence analysis 
and comparison of selected regions among different Yersinia pestis and Yersinia 
pseudotuberculosis strains, Infect. Immun., 67:4851-4861. 

5. Ewing, B., and P. Green, 1998, Base-calling of automated sequencer traces 
1 5 using phred. II. Error probabilities, Genome Res., 8: 1 86-1 94. 

6. Fitch, W.S., 1970, Distingishing homologous from analogous proteins, Syst. 
Zool., 19:99-113. 

7. Frangeul, L., K.E. Nelson, C. Bushrieser, A. Danchin, P. Glaser, and K.F., 
1999, Cloning and assembly strategies in microbial genome projects, Microbiology, 

20 145:2625-2634. 

8. Gordon, D., C. Abajian, and P. Green, 1998, Consed: a graphical tool for 
sequence finishing, Genome Res., 8:195-202. 

10. Li, P., K.C. Kupfer, C.J. Davies, D. Burbee, G.A. Evans, and H.R. Garner, 
1997, PRIMO: A primer design program that applies base quality statistics for 
25 automated large-scale DNA sequencing, Genomics, 40:476-485. 

II. Lukashin, A.V., and M. Borodovsky, 1998, GeneMark.hmm: new solutions 
for gene finding,Nucleic Acids Res. 15.T 107-1 1 15. 



WO 02/092818 PCT/IB02/03059 



REVENDICATIONS 

1. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 
ce qu'elle est choisie parmi les sequences SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID 

5 No. 2345. 

2. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 
ce qu'elle est choisie parmi : 

a) une sequence nucleotidique comportant au moins 75 % d'identite avec une sequence 
choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345 ; 
10 b) une sequence nucleotidique hybridant dans des conditions de forte stringence avec 
une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et 
comprenant au moins 20 nucleotides ; 

c) une sequence nucleotidique complementaire d'une sequence choisie parmi SEQ ID 
No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou complementaire d'une sequence 

15 nucleotidique telle que definie en a), ou b), ou une sequence nucleotidique de 1'ARN 
correspondant a Tune des sequences a) ou b) ; 

d) une sequence nucleotidique d'un fragment representatif d'une sequence choisie 
parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou d'un fragment 
representatif d'une sequence nucleotidique telle que definie en a), b) ou c) et 

20 comprenant au moins 20 nucleotides ; 

e) une sequence nucleotidique comprenant une sequence telle que definie en a), b), c) 
ou d) ; et 

f) une sequence nucleotidique telle que definie en a), b), c), d) ou e) modifiee et 
comportant au plus 10 % de nucleotides modifies par rapport a la sequence de 

25 reference. 

3. Sequence nucleotidique selon la revendication 2, caracterisee en ce qu'il 
s'agit d'une sequence issue d'une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 
139 et SEQ ID No. 2345, et en ce qu'elle code pour un polypeptide, choisi de 
preference parmi les sequences SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 

30 2346 a SEQ ID No. 4481. 

4. Sequence nucleotidique caracterisee en ce qu'elle comprend une sequence 
nucleotidique choisie parmi : 

a) une sequence nucleotidique selon la revendication 3 ou choisie parmi les sequences 
SEQ ID No. 4482 a SEQ ID No. 6617 ; 
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b) une sequence nucleotidique comportant au moins 75 % d'identite avec une sequence 
nucleotidique selon la revendication 3 ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique selon la revendication 3 et comprenant au moins 20 

5 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle que 
definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 

10 f) une sequence telle que ddfinie en a), b), c), d) ou e) modifiee et comportant au plus 
10 % de nucleotides modifies par rapport a la sequence de reference. 

5. Polypeptide code par une sequence nucleotidique selon l'une des 
revendications 2 a 4. 

6. Polypeptide selon la revendication 5, caracteris6 en ce qu'il est choisi parmi 
15 les polypeptides choisis parmi SEQ ID No. 140 a SEQ ED No. 2344, et SEQ ID No. 

2346 a SEQ ID No. 4481. 

7. Polypeptide caracterise en ce qu'il comprend un polypeptide choisi parmi : 

a) un polypeptide selon l'une des revendications 5 et 6 ; 

b) un polypeptide presentant au moins 80 % d'identite avec un polypeptide selon l'une 
20 des revendications 5 et 6 ; 

c) un fragment d'au moins 5 acides amines d'un polypeptide selon l'une des 
revendications 5 et 6, ou tel que defini en b) ; 

d) un fragment biologiquement actif d'un polypeptide selon l'une des revendications 5 
et 6, ou tel que defini en b) ou c) ; et 

25 e) un polypeptide selon l'une des revendications 5 et 6 ou tel que defini en b), c) ou d) 
modifie et comportant au plus 10 % d'acides amines modifies par rapport a la 
sequence de reference. 

8. Sequence nucleotidique codant pour un polypeptide selon la revendication 

7. 

30 9. Sequence nucleotidique isolee codant pour un polypeptide specifique de 

Streptococcus agalactiae choisi parmi les polypeptides de sequence SEQ ID No. 140 a 
SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 . 
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10. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans la biosynthese des acides amines ou Tun de ses fragments. 

11. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
5 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans la biosynthese des cofacteurs, groupes prosthetiques et transporters ou 
l'un de ses fragments. 

12. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide d'enveloppe cellulaire ou situe a la 

1 0 surface de Streptococcus agalactiae ou l'un de ses fragments. 

13. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans la machinerie cellulaire ou l'un de ses fragments. 

14. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
15 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le metabolisme intermediaire central ou l'un de ses fragments. 

15. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le metabolisme energenique ou l'un de ses fragments. 

20 16. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 

caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le metabolisme des acides gras et des phospholipides ou l'un de ses 
fragments. 

17. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
25 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le metabolisme des nucleotides, des purines, des pyrimidines ou 
nucleosides ou l'un de ses fragments. 

18. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

30 implique dans les fonctions de regulation ou l'un de ses fragments. 

19. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de replication ou l'un de ses fragments. 
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20. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de transcription ou l'un de ses fragments. 

21. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
5 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le processus de traduction ou l'un de ses fragments. 

22. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de transport et de liaison des proteines ou l'un de ses 

10 fragments. 

23. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans l'adaptation aux conditions atypiques ou l'un de ses fragments. 

24. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
15 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans la sensibilite aux medicaments et analogues ou l'un de ses fragments. 

25. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans les fonctions relatives aux transposons ou l'un de ses fragments. 

20 26. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 

ce qu'elle est choisie parmi : 

a) une sequence choisie parmi les sequences SEQ ID N° 
6 1 94,6236,5497,5791 ,5 1 03,4705,561 0,5234,4926,633 1 ,6247,5842,574 1 ,492 1 ,5090,5 1 8 
0,4706,4708,5677,6246,64 1 1 ,5578,6446,6447,5607,6209,62 1 5,5406,565 8,4965, de 

25 preference parmi les sequences SEQ ID N°4926,633 1 ,5491 ,5234,6246,5842 ; 

b) une sequence nucleotidique comportant au moins 75 % d'identite avec une 
sequence nucleotidique du a) ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucleotidique du a) ou b) et comprenant au moins 20 

30 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle 
que definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 
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f) une sequence telle que definie en a), b), c), d) ou e) modifiee et comportant 
au plus 10 % de nucleotides modifies par rapport a la sequence de reference ; 

et en ce qu'elle code pour une proteine de surface avec un motif d'ancrage 
LPXTG. 

5 27. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 

ce qu'elle est choisie parmi les sequences SEQ ID 
N°6035,6137,6335,6377,6386,4495,4596,4636,4730,4816,4836,4906,4920,4925,5158,5 
247, 5306,5417,5450,5486,5559,5591,5677,5732,5799,5800,5861,5923 et en ce qu'elle 
code pour une lipoproteine. 

10 28. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 

ce qu'elle est choisie parmi les sequences SEQ ID 
N°4861 ,62 1 4,6061 ,65 1 7,65 1 8,65 1 9,4743,6343,6342,5326,4952,561 9,56 1 8,56 1 7,56 1 6,5 
6 1 5,561 4,56 1 3,561 1 ,5696,597 1 ,5233,5602,5 1 56,5574,5573,5654,5656,5526,5527,5529 
,5534,5625,5626,6223,6229,6230,6231,6232,6233,5764,6095,5089,5466,5465 et en ce 

15 qu'elle code pour une proteine impliquee dans la biosynthese de composes 
polysaccharidiques de paroi. 

29. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans la biosynthese des 
acides amines ou I'un de ses fragments. 
20 30. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la biosynthese des 
cofacteurs, groupes prosthetiques et transporters ou l'un de ses fragments. 

31. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide d'enveloppe cellulaire ou situ6 a la surface de Streptococcus 

25 agalactiae ou l'un de ses fragments. 

32. Polypeptide selon l'une des revendications 5 a 7, caracterise 7 en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans la machinerie 
cellulaire ou l'un de ses fragments. 

33. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
30 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme 

intermediate central ou l'un de ses fragments. 

34. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme 
energetique ou l'un de ses fragments. 
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35. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme des 
acides gras et des phospholipides ou l'un de ses fragments. 

36. Polypeptide selon l'une des revendications 5 a 7, caracterise" en ce qu'il 
5 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme des 

nucleotides, des purines, des pyrimidines ou nucleosides ou l'un de ses fragments. 

37. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans les fonctions de 
regulation ou l'un de ses fragments. 

10 38. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 
replication ou l'un de ses fragments. 

39. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 

1 5 transcription ou l'un de ses fragments. 

40. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 
traduction ou l'un de ses fragments. 

41. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
20 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 

transport et de liaison des proteines ou l'un de ses fragments. 

42. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans l'adaptation aux 
conditions atypiques ou l'un de ses fragments. 

25 43. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la sensibility aux 
medicaments et analogues ou l'un de ses fragments. 

44. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans les fonctions 

30 relatives aux transposons ou l'un de ses fragments. 

45. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 26 et est une proteine de surface avec un 
motif d'ancrage LPXTG. 
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46. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 27 et est une lipoproteine. 

47. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 28 et est une proteine impliquee dans la 

5 biosynthese de composes polysaccharidiques de paroi. 

48. Sequence nucleotidique utilisable comme amorce ou comme sonde, 
caracterisee en ce que ladite sequence est choisie parmi les sequences nucleotidiques 
selon l'une des revendications 2 a 4, 8 a 28. 

49. Sequence nucleotidique selon la revendication 48, caracterisee en ce qu'elle 
1 0 est marquee par un compose radioactif ou par un compose non radioactif. 

50. Sequence nucleotidique selon l'une des revendications 48 et 49, caracterisee 
en ce qu'elle est immobilisee sur un support, de maniere covalente ou non-covalente. 

51. Sequence nucleotidique selon la revendication 50, caracterisee en ce qu'elle 
est immobilisee sur un support tel qu'un filtre a haute densite" ou une puce a ADN. 

15 52. Sequence nucleotidique selon l'une des revendications 49 a 51 pour la 

detection et/ou 1'amplification de sequences nucleiques. 

53. Puce a ADN ou filtre, caracterisee en ce qu'elle contient au moins une 
sequence nucleotidique selon la revendication 5 1 . 

54. Puce a ADN ou filtre selon la revendication 53, caracterisee en ce qu'elle 
20 contient en outre au moins une sequence nucleotidique d'un micro-organisme autre que 

Streptococcus agalactiae, immobilisee sur Ie support de ladite puce. 

55. Puce a ADN ou filtre selon la revendication 54, caracterisee en ce que le 
micro-organisme autre est choisi parmi un micro-organisme associe a Streptococcus 
agalactiae, une bacterie du genre Streptococcus, et un variant de Streptococcus 

25 agalactiae. 

56. Kit ou necessaire pour la detection et/ou 1' identification de bacteries 
appartenant a l'espece Streptococcus agalactiae ou a un micro-organisme assocte, 
caracterise en ce qu'il comprend une puce a ADN ou un filtre selon la revendication 53. 

57. Kit ou necessaire pour la detection et/ou 1' identification d'un micro- 
30 organisme, caracterise en ce qu'il comprend une puce a ADN ou un filtre selon l'une des 

revendications 54 et 55. 

58. Kit ou necessaire pour la detection et/ou la quantification de 1'expression 
d'au moins un gene de Streptococcus agalactiae, caracterise en ce qu'il comprend une 
puce a ADN ou un filtre selon l'une des revendications 53 a 55. 
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59. Vecteur de clonage, et/ou d'expression, caracterise en ce qu'il contient une 
sequence nucleotidique selon l'une des revendications 1 a 4, 8 a 28. 

60. Cellule hote, caracterisee en ce qu'elle est transformee par un vecteur selon 
la revendication 59. 

5 61. Cellule hote selon la revendication 60, caracterisee en ce qu'il s'agit d'une 

bacterie appartenant au genre Streptococcus. 

62. Cellule h6te selon la revendication 61, caracterisee en ce qu'il s'agit d'une 
bacterie appartenant a 1'espece Streptococcus agalactiae. 

63. Vegetal ou animal, excepte l'Homme, comprenant une cellule transformee 
1 0 selon l'une des revendications 60 a 62. 

64. Procede de preparation d'un polypeptide, caracterise en ce que Ton cultive 
une cellule transformee par un vecteur selon la revendication 59 dans des conditions 
permettant 1'expression dudit polypeptide et que Ton recupere ledit polypeptide 
recombinant. 

15 65. Polypeptide recombinant susceptible d'etre obtenu par un procede selon la 

revendication 64. 

66. Procede de preparation d'un polypeptide synthetique selon l'une des 
revendications 5 a 7, 29 a 47, caracterise en ce que Ton effectue une synthese chimique 
dudit polypeptide. 

20 67. Polypeptide hybride, caracterise en ce qu'il comprend au moins la sequence 

d'un polypeptide selon l'une des revendications 5 a 7, 29 a 47 et 65, et une sequence 
d'un polypeptide susceptible d'induire une reponse immunitaire chez l'homme ou 
l'animal. 

68. Sequence nucleotidique codant pour un polypeptide hybride selon la 
25 revendication 67. 

69. Vecteur caracterise en ce qu'il contient une sequence nucleotidique selon la 
revendication 68. 

70. Anticorps monoclonal ou polyclonal, ses fragments, ou anticorps 
chimerique, caracterise en ce qu'il est capable de reconnaitre specifiquement un 

30 polypeptide selon l'une des revendications 5 a 7, 29 a 47, 65 et 67. 

71. Anticorps selon la revendication 70, caracterise en ce qu'il s'agit d'un 
anticorps marque. 
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72 Procede pour la detection et/ou 1' identification de bacteries appartenant a 
Pespece Streptococcus agalactiae ou a un micro-organisme associe dans un echantillon 
biologique, caracterise en ce qu'il comprend les etapes suivantes : 

a) mise en contact de l'echantillon biologique avec un anticorps selon l'une des 
5 revendications 70 et 71 ; 

b) mise en evidence du complexe antigene-anticorps eventuellement forme. 

73. Procede pour la detection de i'expression d'un gene de Streptococcus 
agalactiae caracterise en ce que Ton met en contact une souche de Streptococcus 
agalactiae, avec un anticorps selon la revendication 70 ou 71 et que Ton detecte le 

1 0 complexe antigene/anticorps eventuellement forme. 

74. Kit ou necessaire pour la mise en oeuvre d'un procede selon la revendication 
72 ou 73, caracterise en ce qu'il comprend les elements suivants : 

a) un anticorps selon l'une des revendications 70 et 71 ; 

b) eventuellement, les reactifs pour la constitution du milieu propice a la reaction 
1 5 immunologique ; 

c) eventuellement, les reactifs permettant la mise en evidence des complexes antigene- 
anticorps produits par la reaction immunologique. 

75. Polypeptide selon 1' une des revendications 5 a 7, 32 a 47, 65 et 67, ou 
anticorps selon l'une des revendications 64 et 65, caracterise en ce qu'il est immobilise 

20 sur un support, notamment une puce a proline. 

76. Puce a proteine, caracterisee en ce qu'elle contient au moins un polypeptide 
selon l'une des revendications 5 a 7, 32 a 47, 65 et 67, ou au moins un anticorps selon 
l'une des revendications 70 et 71, immobilise sur le support de ladite puce. 

77. Puce a proline selon la revendication 76, caracterisee en ce qu'elle contient 
25 en outre au moins un polypeptide de micro-organisme autre que Streptococcus 

agalactiae ou au moins un anticorps dirige contre un compose de micro-organisme autre 
que Streptococcus agalactiae, immobilise sur le support de ladite puce. 

78. Kit ou necessaire pour la detection et/ou 1' identification de bacteries 
appartenant a l'espece Streptococcus agalactiae ou a un micro-organisme associe, 

30 caracterise en ce qu'il comprend une puce a proteine selon l'une des revendications 76 
et77. 

79. Kit ou necessaire pour la detection et/ou l'identification d'un micro- 
organisme, caracterise en ce qu'il comprend une puce a proteine selon la revendication 
77. 
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80. Procede de detection et/ou d'identification de bacteries appartenant a 
l'espece Streptococcus agalactiae ou a nn micro-organisme associe dans un echantillon 
biologique, caracterise en ce qu'il met en oeuvre une sequence nucleotidique selon Tune 
des revendications 2 a 4, 8, 9, 1 1 a 13, 17 a 25, 48 a 52 et 68. 
5 81. Procede selon la revendication 80, caracterise en ce qu'il comporte les 

etapes suivantes : 

a) eventuellement, isolement de l'ADN a partir de l'echantillon biologique a analyser, 
ou obtention d'un ADNc a partir de l'ARN de l'echantillon biologique ; 

b) amplification specifique de l'ADN de bacteries appartenant a l'espece Streptococcus 
10 agalactiae ou a un micro-organisme associe a l'aide d'au moins une amorce selon 

1'une des revendications 48 a 52 ; 

c) mise en evidence des produits d'amplification. 

82. Procede selon la revendication 80, caracterise en ce qu'il comprend les 
etapes suivantes : 

15 a) mise en contact d'une sonde nucleotidique selon l'une des revendications 48 a 52, 
avec un echantillon biologique, l'acide nucleique contenu dans l'echantillon 
biologique ayant, le cas echeant, prealablement ete rendu accessible a l'hybridation, 
dans des conditions permettant l'hybridation de la sonde a l'acide nucleique d'une 
bacterie appartenant a l'espece Streptococcus agalactiae ou a un micro-organisme 

20 associe ; 

b) mise en evidence de I'hybride eventuellement forme entre la sonde nucleotidique et 
l'acide nucleique de l'echantillon biologique. 

83. Procede selon la revendication 80, caracterise en ce qu'il comprend les 
etapes suivantes : 

25 a) mise en contact d'une sonde nucleotidique immobilisee sur un support selon la 
revendication 50 avec un echantillon biologique, l'acide nucleique de l'echantillon 
ayant, le cas echeant, ete prealablement rendu accessible a l'hybridation, dans des 
conditions permettant l'hybridation de la sonde a l'acide nucleique d'une bacterie 
appartenant a l'espece Streptococcus agalactiae ou a un micro-organisme associe ; 

30 b) mise en contact de I'hybride forme entre la sonde nucleotidique immobilisee sur un 
support et l'acide nucleique contenu dans l'echantillon biologique, le cas echeant 
apres elimination de l'acide nucleique de l'echantillon biologique n'ayant pas 
hybride avec la sonde, avec une sonde nucleotidique marquee selon la revendication 
49; 
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c) mise en evidence du nouvel hybride forme a l'etape b). 

84. Procede selon la revendication 83, caracterise en ce que, prealablement a 
l'etape a), l'ADN de l'echantillon biologique ou l'ADNc obtenu eventuellement par 
transcription inverse de 1'ARN de l'echantillon, est amplifie a l'aide d'au moins une 
amorce selon l'une des revendications 48 a 52. 

85. Kit ou necessaire pour la detection et/ou 1'identiiication de bacteries 
appartenant a I'espece Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend les elements suivants : 

a) une sonde nucleotidique selon l'une des revendications 48 a 52; 

b) eventuellement, les reactifs necessaires a la mise en ceuvre d'une reaction 
d'hybridation ; 

c) eventuellement, au moins une amorce selon l'une des revendications 48 a 52 ainsi 
que les reactifs necessaires a une reaction d'amplification de l'ADN. 

86. Kit ou necessaire pour la detection et/ou 1' identification de bacteries 
appartenant a I'espece Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend les elements suivants : 

a) une sonde nucleotidique, dite sonde de capture, selon la revendication 50 ; 

b) une sonde oligonucleotidique, dite sonde de revelation, selon la revendication 49; 

c) eventuellement, au moins une amorce selon l'une des revendications 48 a 52 ainsi 
que les reactifs necessaires a une reaction d'amplification de l'ADN. 

87. Kit ou necessaire pour la detection et/ou 1 'identification de bacteries 
appartenant a I'espece Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend les elements suivants : 

a) au moins une amorce selon l'une des revendications 48 a 52; 

b) eventuellement, les reactifs necessaires pour effectuer une reaction d'amplification 
d'ADN ; 

c) eventuellement, un composant permettant de verifier la sequence du fragment 
amplifie, plus particulierement une sonde oligonucleotidique selon l'une des 
revendications 48 a 52. 

88. Procede selon les revendications 72, 73 et 80 a 84 ou kit ou necessaire selon 
les revendications 74, 78, 79 et 85 a 87 pour la detection et/ou 1' identification de 
bacteries appartenant a I'espece Streptococcus agalactiae, caracterise en ce que ladite 
amorce et/ou ladite sonde sont choisies parmi les sequences nucleotidiques selon l'une 
des revendications 2 a 4, 8 a 28, 48 a 52, et 68 specifiques de I'espece Streptococcus 
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agalactiae, en ce que lesdits polypeptides sont choisis parmi les polypeptides selon 
1'une des revendications 5 a 7, 32 a 47, 65 et 67 specifiques de l'espece Streptococcus 
agalactiae et en ce que lesdits anticorps sont choisis parmi les anticorps selon 1'une des 
revendications 70 et 71 diriges contre les polypeptides choisis parmi les polypeptides 
5 selon 1'une des revendications 5 a 7, 32 a 47, 65 et 67 specifiques de l'espece 
Streptococcus agalactiae. 

89. Souche de Streptococcus agalactiae, caracterisee en ce qu'elle contient au 
moins une mutation dans au moins une sequence nucleotidique selon 1'une des 
revendications 2 a 4, 8 a 28. 
1 0 90. Souche de Streptococcus agalactiae selon la revendication 89, caracterisee 

en ce que la mutation mene a une inactivation du gene. 

91. Souche de Streptococcus agalactiae selon la revendication 89, caracterisee 
en ce que la mutation mene a une surexpression du gene. 

92. Utilisation d'une sequence nucleotidique selon 1'une des revendications 2 a 
15 4, 8 a 28, d'un polypeptide selon 1'une des revendications 5 a 7, 32 a 47, 65 et 67 d'un 

anticorps selon 1'une des revendications 70 et 71, d'une cellule selon 1'une des 
revendications 60 a 62, et/ou d'un animal transforme selon la revendication 63 pour la 
selection de compose organique ou inorganique capable de moduler, de reguler, 
d'induire ou d'inhiber l'expression de genes, et/ou de modifier la replication cellulaire 
20 de cellules eucaryotes ou procaryotes ou capables d'induire, d'inhiber ou d'aggraver 
chez un organisme animal ou humain les pathologies liees a une infection par 
Streptococcus agalactiae ou par un micro-organisme associe. 

93. Methode de selection de compose capable de se Her a un polypeptide selon 
1'une des revendications 5 a 7, 32 a 47, 65 et 67, capable de se lier a une sequence 

25 nucleotidique selon 1'une des revendications 2 a 4, 8 a 28, ou capable de reconnaitre un 
anticorps selon 1'une des revendications 70 et 71, et/ou capable de moduler, de reguler, 
d'induire ou d'inhiber l'expression de genes, et/ou de modifier la replication cellulaire 
de cellules eucaryotes ou procaryotes, ou capable d'induire, d'inhiber ou d'aggraver 
chez un organisme animal ou humain les pathologies liees a une infection par 
30 Streptococcus agalactiae, caracterisee en ce qu'elle comprend les etapes suivantes : 

a) mise en contact dudit compose avec ledit polypeptide, ladite sequence nucleotidique, 
avec une cellule transformee selon 1'une des revendications 60 a 62, et/ou 
administration dudit compose a un animal transforme" selon la revendication 63 ; 
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b) determination de la capacite dudit compose a se Her avec ledit polypeptide ou ladite 
sequence nucleotidique, ou de moduler, de reguler, d'induire ou d'inhiber 
l'expression de genes, ou de moduler la croissance ou la replication cellulaire, ou 
d'induire, d'inhiber ou d'aggraver chez ledit organisme animal ou humain les 

5 pathologies liees a une infection par Streptococcus agalactiae ou par un micro- 
organisme associe. 

94. Composition pharmaceutique comprenant un compose choisi parmi les 
composes suivants : 

a) une sequence nucleotidique selon l'une des revendications 2 a 4, 8 a 28 ; 
10 b) un polypeptide selon l'une des revendications 5 a 7, 32 a 47, 65 et 67; 

c) un vecteur selon la revendication 59 ou 69 ; et 

d) un anticorps selon la revendication 70 ou 71 . 

95. Composition selon la revendication 94, eventuellement en association avec 
un vehicule pharmaceutiquement acceptable. 

1 5 96. Composition pharmaceutique selon l'une des revendications 94 et 95 pour la 

prevention et le traitement d'une infection par une bacterie appartenant a l'espece 
Streptococcus agalactiae. 

97. Composition immunogene, caracterisee en ce qu'elle comprend un ou 
plusieurs polypeptides selon l'une des revendications 5 a 7, 32 a 47, 65, et/ou un ou 

20 plusieurs polypeptides hybrides selon la revendication 67. 

98. Utilisation d'une cellule selon l'une des revendications 60 a 62, ou d'un 
vecteur selon l'une des revendications 59 ou 69 pour la preparation d'une composition 
vaccinale. 

99. Composition vaccinale, caracterisee en ce qu'elle contient un 
25 polynucleotide selon l'une des revendications 1 a 4, 8 a 28, un vecteur selon l'une des 

revendications 59 ou 69, et/ou une cellule selon l'une des revendications 60 a 62. 

100. Composition vaccinale, caracterisee en ce qu'elle contient au moins un 
polypeptide cod^par un polynucleotide de sequence choisie parmi SEQ ID 
N° 1 503,678,2 1 92, 1 86 1 ,5 84,280. 

30 101. Composition vaccinale selon la revendication 100, caracterisee en ce qu'il 

s'agit d'une composition veterinaire 

102. Composition immunogene capable d'induire une reponse immunitaire 
cellulaire ou humorale pour la prevention ou le traitement d'une infection par une 
bacterie appartenant a l'espece Streptococcus agalactiae, caracterisee en ce qu'elle 
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comprend une composition immunogene selon la revendication 97, ou une composition 
vaccinale selon la revendication 99 ou 100, en association avec un vehicule 
pharmaceutiquement acceptable et eventuellement un ou plusieurs adjuvants de 
1'immunite appropries. 

5 103. Banque genomique de Streptococcus agalactiae CIP 82.45 (ATCC 

12403). 

104. Banque d'ADN genomique selon la revendication 101, caracterisee en ce 
que ladite banque d'ADN est clonee dans un plasmide. 

105. Banque selon la revendication 101 ou 102, caracterisee en ce qu'il s'agit 
10 de la banque deposee a la CNCM le 28 decembre 2000 sous le N° 1-26 1 0. 

106. Utilisation des banques genomiques selon l'une des revendications 101 a 
103 pour isoler des sequences nucleotidiques specifiques de Streptococcus agalactiae, 
caracterisee en ce que les sequences nucleotidiques de Streptococcus autres que 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) sont alignees et en ce que les 

15 donnees obtenues par cet alignement sont traitees pour isoler lesdites sequences 
specifiques. 

107. Proced6 d'identification de sequence spScifique de Streptococcus 
agalactiae, caracterise par l'alignement de sequences nucleotidiques de Streptococcus 
agalactiae selon les revendications 1 a 4, 8 a 9 et le traitement des donnees obtenues par 

20 cet alignement pour isoler les sequences specifiques. 

108. Souche mutante NEM 1979 de Streptococcus agalactiae selon la 
revendication 89 deposee a la CNCM le 24 avril 2002 sous le N° 1-2861 . 

109. Souche mutante NEM 2056 de Streptococcus agalactiae selon la 
revendication 89 deposee a la CNCM le 24 avril 2002 sous le N° 1-2862. 

25 110. Souche mutante NEM 2057 de Streptococcus agalactiae selon la 

revendication 89 deposee a la CNCM le 24 avril 2002 sous le N° 1-2863. 



